摘要:如果要评价国内最务实、最不激进的AI大模型企业,那么零一万物一定入围榜单:在过去三年间,零一万物进行了三次大转型,而且它的每一次转型都意味着大模型性能比重的降低、商业化落地能力的加强。
作者/文森特
编辑/嘉嘉
如果要评价国内最务实、最不激进的AI大模型企业,那么零一万物一定入围榜单:在过去三年间,零一万物进行了三次大转型,而且它的每一次转型都意味着大模型性能比重的降低、商业化落地能力的加强。
2023年年中至2024年年中,零一万物不断提高旗下大模型的性能;2024年年中至年底,零一万物开始追求模型的商业化能力;2025年初至今,零一万物主动拥抱DeepSeek,其新产品并不是基于自家Yi系列大模型。
从这三次转变中,我们能够感知到,零一万物越来越应用化、越来越务实,这种转变的背后既有李开复对商业逻辑的担心,更有对AI行业发展趋势下的无奈妥协。
【1】大模型急踩刹车
“所以每一个今天已有的APP都可能被AI2.0重构”,2023年,在中关村论坛上,零一万物创始人李开复表示,AI2.0大模型应该是比过去windows、安卓都还要大很多倍,它能够改写所有可以想象的应用,将把既有的软件、使用界面和应用重写一次,改写用户的交互和入口。
除了李开复,不论是腾讯、阿里还是暗月之面等AI创业公司,都将AI大模型视为基础设施,纷纷涌入。据南都大数据研究院统计:截至2025年3月,全国通过备案和已完成登记的AI大模型共有554个。
所有参与竞争的AI企业都知道AI将改变人类生活,但所有人都想成为AI时代的基础设施——让自己的AI大模型成为性能最强大模型,成为AI时代的“ARM”,然后所有的应用开发都建立在它的基础上。
在创业之初,零一万物同其他AI厂商一样,全力推高大模型性能,希望成为AI时代的基础设施。
2023年11月,零一万物开源发布首款预训练大模型Yi-34B,在当年Pretrained预训练开源模型排名榜上,Yi-34B位列全球第一;C-Eva排行榜上,Yi-Lightning模型中国第一,全球第六。
2024年5月,零一万物发布千亿参数Yi-Large闭源模型,该模型在AlpacaEval 2.0英语能力排行榜上,其LC Win Rate(控制文本长度误差的胜率)次于Open AI的GPT-4 Turbo,Win Rate(胜率)则位列世界第一,并表示零一万物已启动下一代Yi-XLarge MoE模型训练,将冲击GPT-5的性能与创新性。
但是在2024年中下旬,零一万物口风开始转变。
据《21世纪商业评论》报道:零一万物内部对Scaling Law的边际收益递减进行推演,最终决定,放弃训练原定万亿参数的超大模型Yi-X-Large,而是转为训练轻量化的MoE(混合专家)模型Yi-Lightning。
在大模型狂飙的赛道上,为什么零一万物突然急踩刹车?原因很简单,在李开复看来,投入与产出不成比例,无法跑通商业逻辑。
“没有收入的四、五十亿美元估值,在 AI 1.0 时代都支撑不了。大模型公司迟早要面对投行拷问,要未雨绸缪,否则这些纸牌屋最后都会坍塌”,在接受晚点LatePost采访时,李开复表示,AI大模型发展需要考虑商业化落地。
【2】迫不得已商业化
据相关数据显示:Yi-Lightning 每百万token仅需0.99元,即14美分,相比GPT-4o每百万token 4.4美元的价格,Yi-Lightning属于“顶级模型白菜价”,即便如此,Yi-Lightning 模型的“预训练”成本为300万美元。
而且很多大模型训练之后,只是为了炫技、刷参数,根本无法解决现实生活中的实际问题。新华财经报道,多家生物医药企业表示,当前通用大模型对药物研发的直接赋能仍然有限。而在生活上,AI幻象也经常出现。
但更为重要的是DeepSeek的出现,直接打断了零一万物成为AI基础设施的想法。
2025年初,DeepSeek以不足其10%的推理训练成本实现了各维度95%的性能,靠堆显卡的发展路径已经被取代,算法开始取代显卡成为未来AI大模型的主要方向。
受到震撼的不仅是海外AI大模型厂商,还有百川智能、阶跃星辰、零一万物、月之暗面等国内企业,DeepSeek独特算法带来的领先优势会不会对他们的大模型实现降维打击,重现互联网时代赢者通吃的情景?
在其他友商陷入恐慌时,李开复却出人意料地宣布拥抱DeepSeek:3月17日,零一万物发布万智企业大模型一站式平台,支持企业一站式部署DeepSeek。
也就是说自己商业化应用产品是基于DeepSeek,而非自身研发的Yi系列大模型,零一万物成为“六小龙”中第一家全面拥抱DeepSeek基座模型。
对于这种投靠DeepSeek,将其视为机遇而非威胁的行为,李开复看的很明白,再将零一万物的重点投入Yi系列大模型,显然是一步“死棋”,原因有两点:
一是AI已经进入到性价比新阶段,同样投入100块钱,其他AI大模型企业可能只能将模型性能提升50%,但DeepSeek能够将性能提升至500%,用十倍的成本去竞争,根本无法持续。
二是DeepSeek的优势在于其算法,但是没有人知道DeepSeek如何实现“低算法高性能”,也就是说这种优势是无法复制的。
打不过+无法学习,对于零一万物来说,与其烧钱死磕不如加入,让DeepSeek成为零一万物的应用“地基”,在商业落地层面实现领先。
【3】商业化成主要方向
“DeepSeek的横空出世,不但是中国的骄傲,而且也带来了更加清晰的终局,也就是开源必将胜出,大模型的格局将从比拼底模的技术指标,走向拥抱开源模型的商业赋能,那么中国就有超大市场、超多场景”,李开复表示,零一万物的业务核心不再是技术,而是落地应用。
而事实也证明了李开复对DeepSeek的判断。
据不完全统计数据显示:广东、江苏、山东、内蒙古、江西等多地宣布,其政务服务系统接入DeepSeek系列大模型;国家电网等在内的超过200家头部企业完成DeepSeek技术接口的集成部署;腾讯元宝等民营企业开始全面接入DeepSeek……
可以说,DeepSeek已经开始成为AI时代的基础设施,2025年2月18日,人民网更是发文称:基于性能卓越、部署轻量化和开源的特性,DeepSeek几乎成为如水电网一样的AI基础设施。
这样的市场表现,也意味着李开复全面拥抱DeepSeek的前瞻性和正确性——大模型性能战争对零一万物已经没有任何意义,将重心放在商业化落地才是零一万物未来出路,“2025年聚焦于应用落地及业务加速增长。”
其实早在2024年年中,零一万物就提出了“从AI Infra到模型,再到应用”的全行业to B解决方案,利用Yi系列大模型为企业赋能,其客户涵盖百胜中国、孩子王、图灵新智算、乐淘互娱、直客通等,零一万物实现了营收一个多亿,并且有利润空间。
到了2025年,零一万物的商业化属性更浓,发挥“拿来主义”,直接在其万智企业大模型一站式平台上,帮助企业用户实现“即插即用”的“DeepSeek自由”。
“未来大模型的行业竞争将不只是模型性能的比拼,更关乎从中台到应用的能力,即模型能否快速响应场景需求、基于中台构建行业应用的能力”,从李开复在万智企业大模型平台发布会上的表态,不难看出,基于DeepSeek的商业化是零一万物的最终方向。
“2025年将是智能体真正发挥作用的一年,到2025年,ChatGPT将开始在现实世界中为你做事”,OpenAI首席产品官凯文威尔直言,ChatGPT将为欧美市场提供AI赋能,但在国内市场也同样如此。
DeepSeek的出现以及无法复刻的技术和成本优势,让其成为中国AI领域底层技术上的基础设施,不论是企业,还是个人,甚至是政府都开始在此获得赋能,但对于其他国内AI大模型厂商来说,成不了AI时代的基础设施,就只能成为基础设施上的建筑物,只不过零一万物转型的比较快。
来源:司库财经