Deepseek、Kimi争相对标o1,初创公司能打破“技术”和“用户”二选一魔咒吗?

B站影视 2025-01-22 11:04 2

摘要:发布密集程度从1月20日Deepseek和Kimi的“前脚后脚”中可见一斑,在Deepseek发布新模型DeepSeek-R1后的两小时内,Kimi推出了k1.5多模态思考模型。

春节将至,国内大模型创业公司集体“凑热闹”,发布了多个对标OpenAI o1的新模型。

发布密集程度从1月20日Deepseek和Kimi的“前脚后脚”中可见一斑,在Deepseek发布新模型DeepSeek-R1后的两小时内,Kimi推出了k1.5多模态思考模型。

图片来源:微信截图

据Kimi官方介绍,新模型在数学、代码、多模态推理能力等方面全面对标“Open AI满血版o1”,这也是Open AI之外的公司首次达到o1正式版水准的多模态推理性能。

“Kimi探索的是C端场景,它探索了一个不同于Deepseek V3的基座模型方案,通过进行长模型和短模型的权重合并,以及短模型的特化RL(意为强化学习),最大化保留了类o1模型的能力。”一位国内头部大模型的算法工程师在20日接受《每日经济新闻》记者采访时表示。

大模型是需要“重仓”投入人才、资金甚至耐心的领域,因此相对于互联网大厂而言,以“AI六小龙”为代表的大模型创业公司面临着更多艰难的选择题。

“创业公司就得做取舍。”在近期的一次采访中,MiniMax创始人闫俊杰认为用户数等指标并非AI竞争的核心,他把技术迭代作为最重要的目标。而Kimi创始人杨植麟在2024年11月接受《每日经济新闻》记者采访时表示,将提升用户留存视为Kimi眼下最核心的任务。

或许正因如此,2024年下半年公众讨论Kimi时多谈及其C端用户体量优势,而Deepseek却以鲶鱼之姿成为了国内大模型的技术焦点。如今,Kimi推出了k1.5,Deepseek也在本月上线了自有App,大模型初创公司在技术和用户上能做好两手抓吗?

集体对标o1,Deepseek、Kimi相继推出新模型

1月20日晚,Deepseek发布了DeepSeek-R1,并同步开源模型权重。据官方介绍,DeepSeek-R1在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩 OpenAI o1正式版。

官方披露,DeepSeek-R1 API(应用程序编程接口)服务定价为每百万输入Tokens1元(缓存命中)/4元(缓存未命中),每百万输出Tokens16元。(注:Tokens指文本被分割成的基本单位)

随后,Kimi也在当晚推出了全新的k1.5多模态思考模型。官方介绍称,从基准测试成绩看,k1.5多模态思考模型实现了SOTA(意为特定时间背景下的最高水平)级别的多模态推理和通用推理能力。

一位国内头部大模型的算法工程师向《每日经济新闻》记者表示:“Kimi探索了一条不同于Deepseek V3的基座模型方案,通过进行长模型和短模型的权重合并,以及短模型的特化RL,最大化保留了类o1模型的能力。”

从表现数据来看,在短链思考(short-CoT)模式下,Kimi k1.5的数学、代码、视觉多模态和通用能力,均超越了全球范围内短思考SOTA模型GPT-4o和Claude 3.5 Sonnet的水平;在长链思考(long-CoT)模式下,Kimi k1.5的数学、代码、多模态推理能力,也达到长思考SOTA模型OpenAI o1正式版的水平。

此外,字节跳动旗下的豆包于1月20日推出了实时语音大模型;“AI六小龙”之一的阶跃星辰也在同天上线了Step-2系列语言模型的两款新品,即参数量小、性价比更高的Step-2 mini以及针对内容创作领域推出的“Step文学大师版”。不难看出,作为当下最为炙手可热的行业,大模型领域的技术竞赛日趋激烈。

技术和用户,初创公司必须取舍吗?

玩家们仍在同一田径场内竞争,但起跑线和赛道已经不同。2025年刚刚开始,国内“AI六小龙”和互联网大厂等有代表性的大模型选手就在战略方向、侧重点上出现了分野。

1月7日,大模型创业公司零一万物CEO李开复回应媒体称,只有大厂能够“烧”(指投入巨资研发)超大模型,零一万物2024年以来的目标,是做小参数、适中的行业模型。 “(零一万物团队中)愿意继续训练超大参数模型的成员,加入了零一万物和阿里云成立的‘产业大模型联合实验室’。”他介绍。

李开复还表示,除了模型训练策略的调整,零一万物还考虑将游戏、金融等方向的AI业务拆分,进行独立运营和融资。

“我们是一家商业公司,而非单纯的技术实验室。”李开复似乎已经用零一万物的转型回答了,大模型初创公司难以兼得“月亮”和“六便士”。

“‘六小龙’的估值增长得非常快,但整体业务的落地收入、用户规模等情况都不太理想。所以投了大模型的投资人在2024年实际上是比较焦虑的。”一位AI领域的投资人在接受《每日经济新闻》记者采访时表示,大模型的商业化路径难题也影响到了投资人的投资心态。

“在产品上,豆包(的用户体量)现在超出了;在技术上,Deepseek、阿里的通义做得也比‘小龙们’好。”在该投资人看来,面临大厂的挑战时,以“AI六小龙”为代表的大模型创业公司需要一定的“生存战略”,这些创业公司要么有产品上的差异化定位,要么有一个足够的时间窗口“往前跑”。

在相对有限的资源、时间之下,“取舍”“聚焦”成为了国内多家大模型创业公司在2024年的战略关键词。

“(2024年)最大的痛苦是不知道要做取舍。当知道了,就不痛苦了。我现在把技术迭代作为我们最重要的目标。”闫俊杰在近期接受媒体采访时表示,如果面对“产品驱动”和“技术驱动”二选一的局面,他会选择后者。

他举例解释,如果要上线一个算法变化,而这可能会影响用户数据,那他会根据算法趋势来决策,“2023年时还会纠结,2024年基本不纠结了”。

而这大概率不是Kimi的想法。杨植麟在2024年11月接受《每日经济新闻》记者采访时表示,将提升用户留存视为Kimi眼下最核心的任务,这一点也能从Kimi在C端用户的争夺力度、既有规模体量上看出。

商业智能数据服务商QuestMobile发布的数据显示,截至2024年12月份,豆包、Kimi、文小言在AI原生App领域的“三强格局”已经形成,月活跃用户规模分别为7523万、2101万和1224万。然而,12月份,豆包与Kimi、文小言的重合用户已分别达到754.1万、409.8万,相比6月份分别上升了5.5%、0.6%。

从以上数据来看,豆包的持续扩张给Kimi带去了不言而喻的压力。

“希望更多技术人才可以通过这份技术报告,了解到Kimi在模型训练方面所做的部分工作。如果感兴趣的话,欢迎加入我们,一起登月。”在官方对k1.5的介绍文章中,Kimi把对人才的招揽也放在了显眼的位置。对于技术迭代和用户规模,Kimi似乎不想做选择题,但如果公司打算兼得二者,则要看Kimi在人力物力上的储备还有多少了。

每日经济新闻

如需转载请与《每日经济新闻》报社联系。

来源:每日经济新闻

相关推荐