李飞飞团队50美元打造AI新星s1,竟是阿里通义千问模型微调的成果?

B站影视 2025-02-07 08:04 2

摘要:斯坦福大学与华盛顿大学的科研团队携手,利用不足50美元的云计算成本,成功培育出一款名为s1的人工智能推理模型。这款模型在数学解题与编程能力上的表现,据相关报道,已与业界领先的OpenAI O1及DeepSeek R1等模型比肩。

近期,科技界传来一则引人注目的消息,斯坦福大学与华盛顿大学的科研团队携手,利用不足50美元的云计算成本,成功培育出一款名为s1的人工智能推理模型。这款模型在数学解题与编程能力上的表现,据相关报道,已与业界领先的OpenAI O1及DeepSeek R1等模型比肩。

然而,深入探究后发现,s1模型的诞生并非完全从零起点出发。《科创板日记》披露,该模型的训练实际上是基于阿里云推出的通义千问(Qwen)模型进行了监督微调。换言之,s1模型的“低成本高效能”特性,得益于站在了一个已经具备强大基础的开源模型肩膀上。

这一发现揭示了人工智能领域的一个新趋势:即便是在资源有限的情况下,通过合理利用现有的开源模型并进行针对性的优化,同样能够创造出具有竞争力的AI产品。s1模型的成功,无疑为众多科研团队和企业提供了一个值得借鉴的范例。

来源:ITBear科技资讯

相关推荐