LLM被指走不通!LeCun推世界模型,AI圈吵翻了?

B站影视 港台电影 2025-10-29 21:01 3

摘要:在麻省理工学院的一场讲座上,图灵奖得主、Meta首席AI科学家LeCun,把矛头对准了现在火得不行的人形机器人产业和大语言模型技术。

图灵奖得主LeCun引发AI技术路线之争:世界模型能否替代大语言模型?

在麻省理工学院的一场讲座上,图灵奖得主、Meta首席AI科学家LeCun,把矛头对准了现在火得不行的人形机器人产业和大语言模型技术。

他说这些公司“压根不知道怎么让机器人变聪明”,还直言大语言模型“就是条死胡同”。

这话一出来,AI圈直接炸了,特斯拉、FigureAI的负责人马上站出来反驳,一场关于AI未来该往哪走的争论,就这么摆到了台面上。

本来想觉得LLM现在这么火,聊天、写东西都挺厉害,应该是AI的主要方向。

但后来发现LeCun敢这么说,自有他的道理。

他不是光批评,还提出了自己认为对的路,构建“世界模型”。

简单说,就是让AI能理解物理世界,还能预测接下来会发生啥,而不是只靠文本数据学东西。

LeCun拿猫举例子,说普通猫的大脑也就2.8亿个神经元,却能看懂三维空间,知道东西放不稳会掉,还能规划怎么跳上桌子。

反观现在的大语言模型,就算训练数据堆得再多,也做不到这些。

我之前看GPT写文章挺惊艳,但让它判断“杯子倒了水会洒在哪”,它还真不一定能说对。

他还举了个更实在的例子,让机器人冲咖啡。

这事看着简单,可机器人得想清楚先拿杯子、再倒水、最后搅拌,每一步做完会有啥结果。

这种对物理世界的“思考”,就是他说的世界模型的核心。

而大语言模型呢?它更像个记忆力超强的学生,背了很多书,却没真正理解书里的内容。

还有个数据挺有意思,LeCun说一个四岁小孩通过眼睛看到的东西,信息量就赶上训练最大LLM的所有文本数据了。

我去查了下,还真有研究支持这个说法,有实验室算过,四岁孩子每天看的画面,信息量是LLM训练文本的好几倍。

这就说明,光靠文本教AI,根本不够它理解真实世界。

当然,也不能全怪LeCun“苛刻”。

他站在学术角度,更看重AI能不能实现“真智能”,而不是暂时能解决几个应用问题。

企业不一样,他们得先把技术落地,让市场看到价值,不然投资怎么续得上?所以这分歧,从根上看就是学术追求和商业现实的碰撞。

特斯拉Optimus项目的负责人JulianIbarz,直接说不认同LeCun的判断,还说特斯拉内部对做通用人形机器人“有明确思路”。

FigureAI的创始人BrettAdcock更直接,让LeCun“别光说,下来做点实事”。

企业这么硬气也能理解,毕竟他们都在人形机器人上砸了不少钱,肯定不想被说“走了错路”。

但有意思的是,这些反驳LeCun的企业,做的技术却悄悄往“世界模型”上靠。

特斯拉的AI负责人AshokElluswamy,之前在ICCV会议上介绍了他们的“神经世界模拟器”。

这东西能根据当前情况,算出接下来会发生啥,这不就是LeCun说的世界模型的思路吗?

FigureAI也一样,BrettAdcock承认,人形机器人有40个自由度,可能的动作组合比宇宙原子还多,没法靠编程解决,只能靠神经网络。

这话听着,不就是在支持LeCun“需要新AI架构”的观点吗?还有获OpenAI投资的1XTechnologies,直接把研发重点放在世界模型上,做出来的系统里有视觉编码器、动作编码器,跟LeCun设想的几乎一样。

我觉得这事儿特真实,企业嘴上不服软,是怕影响市场信心;但实际做技术时,还是得跟着合理的方向走。

毕竟技术这东西,光靠嘴硬没用,得真能解决问题才行。

就像1XTechnologies,拿到了OpenAI的投资,说明它的世界模型路线,也得到了行业大玩家的认可。

就算大家都觉得世界模型是个好方向,要做出来也没那么容易。

首先是计算能力的问题,处理视觉、听觉、触觉这些多模态数据,需要的算力不是一般的大。

现在最先进的芯片,处理起来也有点费劲。

其次是数据,世界模型需要大量和环境交互的数据,这些数据收集起来又贵又麻烦。

还有就是怎么判断AI做得好不好,目前还没有统一的标准。

人形机器人要走进现实,还有额外的麻烦。

马斯克就说,现在连量产需要的供应链都没有,特斯拉计划2026年推出能量产的OptimusV3原型机,能不能按时成,还不好说。

1XTechnologies的CEO更实在,他说让机器人进家庭,连Wi-Fi连接的问题都比技术本身难解决。

你想啊,家里地面有地毯有瓷砖,光照忽明忽暗,这些都得让机器人适应。

不过也不用太悲观,现在技术也在慢慢进步。

比如自监督学习方法,能降低数据收集的成本;仿真环境也越来越逼真,能帮AI先在虚拟里练手。

LeCun说“未来3-5年世界模型会成主流”,这话可能有点乐观,但大方向肯定没错。

这场争论最大的意义,不是谁赢谁输,而是让整个AI行业重新思考“智能到底是什么”。

之前大家都盯着大语言模型,觉得能聊能写就是智能;现在LeCun一提醒,才更清楚,能理解真实世界、解决物理问题,才是更关键的一步。

最后再提个小细节,LeCun特意说自己没参与Meta的Llama大语言模型项目,还说第一代Llama是巴黎团队的“海盗项目”。

这种敢和公司主流产品保持距离的态度,还挺让人佩服的。

这也说明,真正的学者,不会因为商业利益就放弃自己的判断。

这场AI技术路线之争,更像一次行业“大讨论”。

LeCun的批评敲了警钟,产业界的实践探索了路径。

不管最后是世界模型替代大语言模型,还是两者结合,对AI行业来说,都是在往更成熟的方向走。

毕竟只有不断争论、不断试错,技术才能真正进步。

来源:律行僧

相关推荐