2024如日中天的“六小虎”,2025究竟能撑多久?

B站影视 2025-02-08 18:06 2

摘要:我吃惊的发现,经过短短十天,DeepSeek这样的AI大模型,竟然能够普及到大众认知的层面。回顾过去的一年,有“轻舟已过万重山”的感觉,‌AI时代的时间感知被加速‌,一年所取得的进步可能相当于过去的几年,一年发生的震荡也相当于过去的几年。

文|未来图灵

春节期间,和我高中老师见面,他跟我聊的第一个话题是:DeepSeek这样的AI,对于教育行业将带来哪些影响?

我吃惊的发现,经过短短十天,DeepSeek这样的AI大模型,竟然能够普及到大众认知的层面。回顾过去的一年,有“轻舟已过万重山”的感觉,‌AI时代的时间感知被加速‌,一年所取得的进步可能相当于过去的几年,一年发生的震荡也相当于过去的几年。

股权与激励背后的钱和人

月之暗面在2024年3月11日的微信公众号发布了一篇名为《和月之暗面一起,投身未来10年最值得做的一件事》的文章,推出了全新的员工激励计划。该计划具体措施包括在公司取得重要进展时发起员工期权回购计划,并且明确表示在2024年底启动首次期权回购计划。同时,每年还会定期根据员工的工作表现进行调薪和期权增发,以此确保薪酬和期权能够充分反映员工个人的成长和贡献。

有业内人士事后解读,这一激励计划有可能和该公司创始人套现有关。“创始人套现后,其他员工不干了,肯定要逼迫公司明确期权回购计划。”

后面果然有创始人套现传言传出。2024年4月24日界面新闻报道称,上一轮融资完成后,月之暗面公司创始人杨植麟通过售出个人持股已套现数千万美金。“有传言创始人及相关人员套现金额在4000万美金。”一位业内投资人透露道,“公司成立第一年就套现这么多,这种情况并不多见。”这一消息瞬间在行业内引起了轩然大波,质疑声和猜测声此起彼伏。在公司刚刚起步,未来发展还充满不确定性的时候,创始人的大额套现行为,让员工和投资者们都感到不安。尽管月之暗面否认了套现消息,但质疑声并未平息。

随着时间的推移,期权回购的问题又浮出水面,小红书上有爆料称,期权回购价格被打到“骨折价”。有业内人士表示,2024年3月发布这一激励计划,疑似是在杨植麟套现后,面临各方压力下的举措。这一计划的背后,是为了安抚内部员工情绪,也可能有吸引投资的考量。

关于张予彤的身份问题,同样引发了诸多讨论。月之暗面创始人杨植麟在2024年12月回应他与循环智能早期投资人的纠纷时提到,授予张予彤股份,作为其在月之暗面联合创始人的身份以及对后续多年持续工作的对价。

根据此前的朱啸虎声明,循环智能的董事决议是2024年1月完成签字同意分拆,对应时间表,这个时间点发生在月暗敲定阿里的关键融资后。据晚点此前报道,2023年底正寻求融资的月之暗面,找到了阿里,直接把投前估值提高到15亿美元。

据业内人士透露,该笔融资张予彤确实起到了决定作用,是让月之暗面投后估值直接达到23亿美元的关键人物。业内人士表示,杨植麟2024年12月的回应足以毁掉她(张予彤)的事业。回应称,张予彤一开始就是联合创始人,这实际上是非常致命的。因为她当时代表金沙江创投的LP来投资杨植麟参与创办的循环智能,同时又是杨植麟创办的月之暗面的联合创始人,还占有14%的股份,“这简直是在玩火。”知情人士称。这种利益冲突的局面很难在短时间内得到妥善解决。

零一撬了月之暗面的单?

2025年1月6日晚,有消息称零一万物将把预训练团队和算力资源打包出售给阿里云。李开复很快在朋友圈辟谣称,“不知为什么会有这样的谣言散播,不过散的快,撤的也快。”零一万物公众号在凌晨发布官方回应,否认“阿里收购零一万物”。

随后,李开复表示,零一万物预训练和Infra团队中愿意训练超大参数模型的成员与阿里云团队实际上完成了一次双向选择,由于超大模型的训练是由阿里云主导,在联合实验室中进行,所以这些成员大部分加入了阿里云联合实验室,成为阿里的员工。

有知情人士透露,“起初是月之暗面在与阿里洽谈合作,但后来被拒。”——这一消息一直在网上流传,没有得到官方的证实。而此前,据阿里巴巴财报披露,该公司于2024财年向月之暗面投资合共约8亿美元,购入约36%股权,位于月之暗面的优先股投资。

知情人士还透露,当时负责月之暗面投资的人还有人因此被裁。而阿里云最终选择零一万物,是看中其预训练团队。长文本相关技术,通义千问本身就能做,不具有互补性,所以未被阿里云接纳。

医疗的水很深,百川怎么走?

2024年12月31日,百川智能与北京市海淀区卫健委签署战略合作。据称,双方将探索以AI助力基层医疗发展,共同打造“AI医生-真人医生双医协同”的基层医疗服务新模式。

百川智能在2024年明确了走向医疗的赛道。不过,业内有分析认为,医院体系复杂,水也很深,进入难度极大;最重要的是规模化方面也有难度。此前也有不少企业尝试进入医疗赛道,但都遭遇了重重阻碍,百川智能想要在这个领域取得突破,并非易事。

2024年12月9日,有消息称百川智能联合创始人、商业化负责人洪涛已经离职。据《智能涌现》消息称,据接近百川智能的人士透露,洪涛已不再参与公司日常运营,且离职已有一段时间。也有接近百川智能人士向未来图灵表示,洪涛已离职半年多,据推测离职时间为2024年8月,他从2023年7月创办百川智能负责商业化工作,仅一年多就离开。

洪涛的离职引发了外界的广泛猜测,他作为公司的联合创始人兼商业化负责人,在公司转型关键时期离开,是否与公司在医疗赛道的发展前景不明有关?

表面风光的智谱、MiniMax?

智谱的发展之路也并非一帆风顺,尤其是在上市和业务盈利方面,面临着巨大的挑战。

2021年3月和6月,清华大学计算机系WeBank讲席教授唐杰带队先后发布了中国首个超大规模智能模型“悟道1.0”和“悟道2.0”。2023年8月,基于唐杰团队的开源双语预训练模型,北京智谱华章科技有限公司推出了生成式AI助手“智谱清言”。

近期,一则上市企业公告披露了智谱AI的股权结构。智谱AI灵魂人物唐杰直接持股8.12%,智谱AI董事长刘德兵持股0.3914%,智谱AI CEO张鹏持股0.1286%。

有知情人士透露称,清华大学要求所有教授投的公司,禁止担任实际控制人,公司现在名义上没有实控人。

智能超参数在《中国大模型中标项目监测报告》中重点跟踪了包括智谱在内的6家国内知名通用大模型厂商的表现。2024年1-9 月,智谱的中标项目数量达到22个,在6家厂商中排名第三,领先于腾讯云、阿里云、火山引擎等传统大厂。但也有知情人士指出,智谱以较低的价格中标了国企项目,后续的盈利能力是一个挑战。

MiniMax在发展过程中,将业务重点转向了海外市场。其旗下的明星产品Talkie在海外市场取得了一定的成绩。根据Sensor Tower数据显示,Talkie在2024年上半年成为美国下载量第四的人工智能应用,超越了由谷歌支持的竞争对手Character.AI,后者排名第十。Talkie在2024年前八个月的全球下载量已达到1700万次。

然而,繁荣的背后却隐藏着诸多问题。

去年MiniMax盈利主要靠面向消费者的业务,但这种发展模式显然存在着巨大的风险。版权问题成为了MiniMax面临的最大挑战之一,2025年1月7日,有报道称爱奇艺已向上海市徐汇区人民法院提起诉讼,称MiniMax未经授权使用了爱奇艺享有版权的素材进行模型训练,要求MiniMax立即停止侵权行为,并索赔10万元人民币。此外,MiniMax在海外市场也遭遇了挫折。据Z Finance2024年12月19日消息称,其旗下的明星产品Talkie疑似在美国服务器下架。

“套壳”大模型遍地都是

在整个大模型行业中,除了“六小虎”自身的发展动态,行业技术趋势也暗流涌动。近期小红书上有一批博主称,一些大模型你在使用它时,他会乱说自己的名字和模型信息。一位博主称,最近“风很大”Deepseek也用了知识蒸馏的训练手段。知识蒸馏的目的是,将大型LLMs(大型语言模型)的知识转移到更小的模型中,从而实现资源效率和性能的平衡。在ICE(身份一致性评估)测试中,GLM-4-Plus、Qwen-Max和DeepSeekV3等模型表现出较高的蒸馏程度,而Claude-3.5-Sonnet和Doubao-Pro-32k等模型则表现出较低的蒸馏程度。

该博主还表示,蒸馏本身只是另一种技术路径,只是过度蒸馏会导致模型同质化,降低模型多样性并损害其处理复杂或新任务的能力(类似近亲结婚的逻辑)。

在国产大模型DeepSeek引起热议之际,OpenAI联合创始人兼CEO萨姆・奥特曼(SamAltman)发文感谢团队,并表示“复制容易,创新很难。”奥特曼在社交平台X上发帖称:“复制你知道行得通的东西是(相对)容易的。当你不知道它是否行得通时,做一些新的、有风险的、困难的事情是非常困难的。当个人研究人员这样做的时候,他们理所当然地得到了很多荣誉!这是世界上最酷的事情。”

图片来源:Sam Altman社交平台

他补充称:“召集一支有才能的大型研究团队一起在迷雾中攻克一座新山峰也是极其困难的。这是推动进步的关键。感谢伊利亚、雅各布、鲍勃、马克,还有许多其他杰出的研究领导者,他们让我们来到这里。”

也有业内人士表示,DeepSeek更多是被小厂家用于研究。程序员在写代码时对其评价较高,认为比其他AI软件好用、专业。然而,政府对其认可度不高,大厂也有自己的模型,这使得DeepSeek的市场推广面临一定困难。

行业兴起之初,所有入局者都信心满满,认为市场充满机遇,资金和人才都能顺利获得。但在实际发展过程中,尤其是船至中流,却开始遭遇兜头的一盆又一盆冷水,后续发展如何,其实真正的大考才刚刚开始。

来源:蓝鲸财经

相关推荐