摘要:斯坦福大学与华盛顿大学的科研团队携手,利用不足50美元的云计算成本,成功培育出一款名为s1的人工智能推理模型。这款模型在数学解题与编程能力上的表现,据相关报道,已与业界领先的OpenAI O1及DeepSeek R1等模型比肩。
近期,科技界传来一则引人注目的消息,斯坦福大学与华盛顿大学的科研团队携手,利用不足50美元的云计算成本,成功培育出一款名为s1的人工智能推理模型。这款模型在数学解题与编程能力上的表现,据相关报道,已与业界领先的OpenAI O1及DeepSeek R1等模型比肩。
然而,深入探究后发现,s1模型的诞生并非完全从零起点出发。《科创板日记》披露,该模型的训练实际上是基于阿里云推出的通义千问(Qwen)模型进行了监督微调。换言之,s1模型的“低成本高效能”特性,得益于站在了一个已经具备强大基础的开源模型肩膀上。
这一发现揭示了人工智能领域的一个新趋势:即便是在资源有限的情况下,通过合理利用现有的开源模型并进行针对性的优化,同样能够创造出具有竞争力的AI产品。s1模型的成功,无疑为众多科研团队和企业提供了一个值得借鉴的范例。
来源:ITBear科技资讯
免责声明:本站系转载,并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题,请在30日内与本站联系,我们将在第一时间删除内容!