李飞飞团队50美元复刻DeepSeek:基于阿里通义千问模型监督微调

B站影视 2025-02-07 07:26 3

摘要:李飞飞等斯坦福大学和华盛顿大学的研究人员以不到50美元的云计算费用,成功训练出了一个名为s1的人工智能推理模型。该模型在数学和编码能力测试中的表现,据称与OpenAI的O1和DeepSeek的R1等尖端推理模型不相上下。

三言科技2月7日消息,据报道,李飞飞等斯坦福大学和华盛顿大学的研究人员以不到50美元的云计算费用,成功训练出了一个名为s1的人工智能推理模型。该模型在数学和编码能力测试中的表现,据称与OpenAI的O1和DeepSeek的R1等尖端推理模型不相上下。

不过,据《科创板日记》报道,s1模型的训练并非从零开始,而是基于阿里云通义千问(Qwen)模型进行监督微调。s1模型的“低成本”特性是建立在已具备强大能力的开源基础模型之上。

来源:小英议科技

相关推荐