图灵奖得主杨立昆:统治欲望源于生存需求,而非智能水平,AI 不会有这种想法 | AI 2025

B站影视 2024-12-31 19:44 2

摘要:岁末年关,AI 科技大本营「2025 AI 前瞻周」正式拉开帷幕。在这一周的时间里,我们将寻找最资深、最专业、最丰富的专家角度,为读者带来一场关于 2025 年人工智能的前瞻性思考盛宴。

岁末年关,AI 科技大本营「2025 AI 前瞻周」正式拉开帷幕。在这一周的时间里,我们将寻找最资深、最专业、最丰富的专家角度,为读者带来一场关于 2025 年人工智能的前瞻性思考盛宴。

本周一的内容是图灵奖得主、Meta 首席人工智能科学家杨立昆(Yann LeCun)的最新采访。和前段时间火药味颇重的

「怒怼马斯克」

访谈不同,这次采访以技术内容为主,LeCun 将一一回应自己在 2024 年提出的那些 AI 前沿观点,同时分享他对 2025 年人工智能发展的深刻见解与宏伟蓝图。

2024 年,人工智能领域迎来一个历史性时刻:深度学习先驱 Geoffrey Hinton 与 John Hopfield 共同斩获诺贝尔物理学奖,这是 AI 研究首次获得物理学最高荣誉,标志着计算科学与物理学的历史性融合。

近日,Meta 首席 AI 科学家、图灵奖得主杨立昆(Yann LeCun)接受了加州大学圣地亚哥分校杰出物理学教授Brian Keating 的专访。由于是和物理学专家的对话,所以与前段时间对话知名记者 Kara Swisher 明显不同,LeCun 的许多回答直指 AI 技术前沿,面对物理学家大秀了一番自己在物理方面的造诣。

当 Keating 以宇宙学家的视角,用爱因斯坦 1907 年的自由落体思想实验挑战 AI 的创造力时,对话瞬间升温:“没有物理实体的AI系统,如何才能像爱因斯坦那样构建新的物理定律?”作为西蒙斯天文台首席研究员、著名的宇宙微波背景辐射(CMB)专家,Keating 带来的不仅是关于宇宙起源的思考,更是对 AI 本质的深层拷问。

采访中,LeCun 给出了许多总结性的观点:

“我认为这将是未来几年 AI 领域的重大挑战:如何超越自回归式大语言模型架构,发展能够理解真实世界、获得某种常识的架构。”

“强化学习效率如此之低,以至于它不可能解释我们在人类和动物身上观察到的那种高效学习。因为我们学习的大部分内容都不是被教导的,而是自己悟出来的。”

“我避免使用 AGI 这个词的原因,并不是因为我不相信 AI 系统最终会变得和人类一样聪明。”

“要达到让大众认可的人类级智能,就算是在最理想情况下——比如 JEPA 架构和其他设想都成功实现,我也看不到 5-6 年内能够实现。”

“在未来两年内可能发生的是:普通人越来越难找到最新的聊天机器人无法回答的问题。聊天机器人确实越来越厉害了,那请问家用机器人在哪里?完全自动驾驶的汽车在哪里?能在 20 小时练习中学会开车而不会撞车的自动驾驶汽车在哪里?”

“认为高智能必然导致统治欲望的想法是错误的。这种行为源于物种的生存需求,而不是智能水平。”

“寻找可证明安全的 AI 系统,是不可能的。”

“智能是社会最缺乏也最宝贵的资源。AI 增强人类智能的影响力可能堪比 15 世纪的印刷术。”

“人类水平的 AI 是个产品需求,一旦实现就会产生巨大影响。”

以下为对话全文:

AI 还是不如猫

主持人:LeCun,欢迎来到我的播客节目。你戴的这副智能眼镜是我最喜欢的科技产品,我现在已经用上第二代了。说起智能眼镜,我之前也买过 Apple Vision Pro,虽然对一个公立大学教授的工资来说这确实有点奢侈,不过最后我还是在退货期内退掉了。

杨立昆:我头上这副已经是我的第三副雷朋(Ray-Ban)智能眼镜了。第一代用过一段时间,第二代是去航海的时候因为船翻了进水坏掉的。因为那会儿还是早期产品,我就把它寄回给我们的同事,让他们分析一下到底是哪里出了问题,后来他们又给我寄来了一副新的。

主持人:说实话,我觉得这种智能眼镜真的代表着未来的方向。我用过 Apple Vision,也体验过 Meta Quest,玩游戏的时候感觉还不错,我家孩子们都很喜欢跟我抢着玩。但这些眼镜都有一个共同的问题:太重了。从人类的生物本能来说,我们并不喜欢视野受到限制,因为这样可能会让捕食者有机可乘。相比之下,我特别喜欢这种眼镜的增强现实体验,显示质量也很棒。虽然这听起来像在给 Meta 做广告,但我确实觉得苹果在这方面应该能做得更好,他们现在这个产品恐怕很难持续下去。

不过今天我们主要还是要聊物理学。我想请你跟我们的听众解释一下——镜头里,我背后墙上的这句“打开舱门”(Open the Pod Bay Doors)对你来说意味着什么?

杨立昆:这句话来自《2001 太空漫游》这部经典电影。这部电影对我的影响特别深远。我是在 9 岁时看的首映,当时被电影中探讨的各种主题深深吸引:宇宙、太空旅行、智能是如何产生的。虽然那时候年纪还小,但已经对智能计算机这样的概念着迷不已。

主持人:很多人可能不知道,我们现在经常说的“播客”(podcast)这个词就来源于这部电影。在你们的竞争对手苹果公司,有位工程师叫 Vinnie Chieco(旧金山独立撰稿人,iPod 的命名者),他和你一样也是受到了 HAL 9000 的启发。当他看到电影里那个闪亮的白色小型设备原型时,提议把自己的产品命名为 iPod,这就是“podcast”这个词的由来。说起来,这部电影里描述的人工智能现在可能会让一些研究者感到担忧,比如最近刚获得诺贝尔奖的 Geoffrey Hinton(“AI 教父”,图灵奖得主)。

我想从你今年 10 月在《华尔街日报》上的一段话开始我们的对话,这段话引起了我的兴趣,也很有挑战性。你说“AI 的智能水平勉强赶上猫”——你可能还没见过我家的猫,它会故意把水杯打翻在我的笔记本电脑上,还会玩弄死老鼠取乐——我实在想象不出 AI 会做这种事,除非在元宇宙的每个房间都装上激光笔。所以,你说这句话是想表达什么?这样说是想让我们感到安心吗?

杨立昆:我的意思是,即使是现在最先进的大语言模型,虽然在语言处理方面表现惊人,但它们对物理世界基本上没有任何理解,因为它们完全是通过文本训练的。它们获得的世界图景完全来自人类的表述,这种表述首先是符号化的,而且是近似的、简化的、离散的。真实世界要比这复杂得多。我们的 AI 系统完全无法处理真实世界。这就是为什么我们有能通过律师资格考试的大语言模型,却还没造出 10 岁孩童水平的机器人——比方说,有些任务对一个10岁的孩子来说轻而易举,甚至不需要花什么脑力就能一次性学会。

而猫就可以轻松完成这些任务。猫如果想跳到某个感兴趣的物体上时,它会先坐下来,转动脑袋规划路线,然后一跃一跃地精确到达目标。它们是怎么做到的?很显然,这些举动说明猫能够规划,能够推理,理解物理世界,对自身的动态特性和很多事物的直觉物理学都有极其出色的认知。这些都是我们现在的计算机还无法复制的能力。

理解世界的本质,探索智能的核心

主持人:对这些技术的乐观和悲观态度都让我觉得很有意思。我想到了所谓的“修昔底德陷阱”,就是当一个新兴力量崛起时,尽管它还很弱小,但已经主导力量却会把全部注意力都集中在它身上。这有点类似于沉没成本谬误。

我想听听你的看法:在物理科学领域,我们是不是正在把自己推向一个死胡同?这种基于 GPU 和大语言模型的方法似乎正在吸走这个领域的所有资源和注意力。从消费者的角度来看,这种趋势推动 NVIDIA 市值达到 3 万亿美元。我们现在是不是已经完全投入到 GPU 加大语言模型这条路上去了?这会不会扼杀物理学等领域的真正创新?

立昆:这个问题的答案既是肯定的也是否定的。确实,如果我们一直沉迷于大语言模型,让它吸走其他所有的资源和注意力,目前的情况看起来确实有点这种趋势。大语言模型就像是一把锤子,现在所有东西看起来都像钉子——这其实是一个错误。这也是我一直在强调的观点:大语言模型并不是 AI 的全部。考虑到它们在概念上的简单性,它们的能力确实令人惊讶。但有很多事情它们做不到,其中之一就是表达和理解物理世界,更不用说在物理世界中规划行动了。

我认为这将是未来几年 AI 领域的重大挑战:如何超越自回归式大语言模型架构,发展能够理解真实世界、获得某种常识的架构。

对于需要深思熟虑的复杂任务,我们的智能运作方式是这样的:我们会建立一个关于世界运作方式的心智模型,让它想象我们的行动会产生什么结果,然后优化这些行动序列来实现特定目标——这就是当猫站着观察并思考跳跃轨迹时在做的事情,这就是规划。它们对自己有心智模型,对要跳过的物体也有心智模型。我们经常在不知不觉中做这样的事情。这对物理学家来说应该很有意思,如果你感兴趣,我们接下来可以详细讨论这个话题。

主持人:可以。1907 年,爱因斯坦做了一个思想实验

来源:人工智能学家

相关推荐