摘要:5月24日,Google DeepMind的联合创始人兼CEO Demis Hassabis接受海外播客Hard Fork访谈,本次对话围绕Google I/O的最新发布(如Gemini、Astra与VEO3)及其对普通用户的意义展开,进一步探讨了Google
5月24日,Google DeepMind的联合创始人兼CEO Demis Hassabis接受海外播客Hard Fork访谈,本次对话围绕Google I/O的最新发布(如Gemini、Astra与VEO3)及其对普通用户的意义展开,进一步探讨了Google对AGI的全面拥抱及其背后的战略考量。访谈还涉及AI技术快速发展带来的产品化挑战、研发与商业化的资源分配、AGI的实现时间表与清晰定义,以及通往AGI的技术路径。此外,双方还就AI对未来教育模式、就业市场格局的深远影响,社会如何面对和选择AI技术,以及AI与人类创造力进行深入交流。
关于AGI的未来,他提到,AGI的高标准是能完成人类大脑所有理论工作,其实现路径将融合渐进式改进与重大突破。
以下是本次对话实录
经数字开物团队编译整理
01 Google正变得更加“AGI化”
主持人提问:在Google I/O大会发布的众多内容中,您认为哪一项对普通用户意义最为重大?近年来,Google似乎在全面拥抱AGI的理念,高层也开始公开谈论AGI,您如何解释这种转变?
Demis Hassabis:谢谢再次邀请我。我们确实宣布了很多内容。对普通用户而言,我认为最重要的是那些新的、更强大的模型。而且我希望,这种 Astra 类型的技术能够集成到 Gemini Live 中。当人们第一次使用它,并意识到如今的 AI 已经能做到远超他们想象的事情时,那种体验真的非常奇妙。此外,VEO3 可能是本次发布会中最重要的成果,现在似乎正在迅速传播开来,这也非常令人兴奋。
关于Google对AGI理念的转变,我认为,在整个体系中,AI 部分正变得越来越核心。我有时会将 Google DeepMind 形容为 Google 的“引擎室”。如果你回顾一下昨天的开场演讲,便能真切地感受到这一点。而且,情况已经非常明朗——用“AGI-pilled”这个词或许恰如其分——我们距离实现人类水平的通用智能已经非常接近了。或许比人们几年前预想的还要近,它将带来广泛且贯穿各个领域的影响。您在主题演讲中还观察到了另一点,那就是 AGI 几乎无处不在,因为它是一个将支撑起一切的横向基础层。我想每个人都开始理解这一点了,或许 DeepMind 的一些核心理念也正在逐步融入 Google 的整体文化之中,这是一件很棒的事情。
02 AI技术落地与研发策略
主持人提问:您提到Project Astra正在驱动一些人们甚至可能尚未意识到AI已能实现的功能,这反映了AI行业面临的挑战:模型能力强大但产品未能充分展现或用户尚未完全发掘。您如何看待此挑战?在研究之外,您本人在多大程度上参与产品问题的探讨?Gemini不仅能支持生产力助手类应用,还能助力解决基础科学和研究挑战,这本质上是同一个问题,可以用一个强大通用模型解决,还是截然不同的问题,需要不同方法?AI公司在推动基础模型核心AI研发与商业化成果转化之间,应如何分配资源?
Demis Hassabis:这是个非常好的问题。我认为,这个领域面临的挑战之一,显然是底层技术正以令人难以置信的速度飞速发展。这一点甚至与互联网和移动技术等其他重大革命性技术也有显著不同。在某个阶段,技术栈会趋于稳定,从而可以将重点放在产品开发或利用该技术栈上。但我们现在的情况是——我认为这非常特殊,但从研究者的角度来看也异常激动人心——技术栈本身正在以惊人的速度持续演进。因此,我认为这给产品方面带来了独一无二的挑战。这不仅对我们 Google 和 DeepMind 如此,对初创公司,对任何规模的公司而言都是这样:当你预见到某项技术在一年内可能提升 100% ,你当下应该押注什么?这就产生了一个有趣的局面:你需要具备相当深厚技术背景的产品人员、产品设计师和经理,才能预判一年后技术可能达到的水平。有些事情目前无法实现,但你又想设计一款一年后推出的产品。因此,你必须对技术及其发展方向有非常深刻的理解,才能判断哪些功能是可以依赖的。所以,这是一个很有意思的课题。我想这也是为什么我们看到如此多不同的尝试在进行。一旦某个尝试成功,我们就必须迅速加大投入。
关于Gemini在生产力与科研领域的应用,当你审视这一切时,会发现它涵盖的领域极其广泛,这是事实。那么这些看似不同的事物之间究竟有何关联呢?除了我对它们都抱有浓厚兴趣之外。构建通用智能的初衷,始终是追求真正的通用性,并且以我们目前的方式来实现,它应该能够适用于几乎任何事物。无论是提升生产力——这非常令人兴奋,能够帮助数十亿人的日常生活——还是攻克科学领域最艰巨的难题。我会说,其中 90% 的基础是核心的通用模型,在我们的例子中,就是 Gemini,特别是其后续更强大的版本。然而,在大多数这些特定领域,你仍然需要额外的应用研究,或者针对该领域的一些特殊调整,比如特定的数据或处理方式,才能解决具体问题。我们或许会与科学领域的专家合作。但从根本上说,当你成功攻克其中一个领域时,可以将从中获得的经验和知识反馈到通用模型中,从而使通用模型变得越来越强大。这形成了一种非常有趣的飞轮效应。而且,对于像我这样对许多事物都充满好奇心的人来说,这带来了极大的乐趣。你可以运用这项技术,进入几乎任何你感兴趣的领域进行探索。
关于资源分配,我认为许多 AI 公司目前都在努力解决一个核心问题:应该投入多少资源来推动基础模型的核心 AI 研发,从而在基础层面提升模型性能;与此同时,又应该投入多少时间、精力和资金来尝试将部分成果剥离出来进行商业化,并将其转化为产品。我能想象,这既是资源方面的挑战,也是人员方面的挑战。我们并不会强制安排,这在内部很大程度上是一种自我选择。
03 当前AI在原创性发明思考和一致性方面仍有差距
主持人提问:您和Google联合创始人Sergey Brin对AGI实现时间的预期有所不同,他认为在2030年前,您则稍晚,是什么导致了这种差异,尽管你们掌握相同的信息和技术路线图?您如何定义AGI,以及当前系统在哪些方面尚未达到AGI水平?您认为缩小与AGI的差距是通过模型的渐进式改进,还是更有可能迎来某种技术突破实现智能爆炸?
Demis Hassabis:并非如此。首先,如果他的预期是 2030 年前,而我的是在那之后,我们的时间表其实相差不大。而且,我的时间表自 2010 年 DeepMind 成立以来就相当稳定。我们当时认为这大约是一个 20 年的使命,而令人惊喜的是,我们目前仍在正轨上。所以我认为 AGI 大约会在那个时间点出现。而且我感觉,我其实有一个概率分布,其中概率密度最大的区间是从现在起的 5 到 10 年。我认为部分原因在于,精确预测 5 到 10 年后的任何事情都非常困难,所以预测本身就带有不确定性。此外,还需要多少项突破才能实现 AGI,这一点也存在不确定性,对吧?还有就是关于 AGI 的定义。我对此一直有一个相当高的标准,那就是它应该能够完成人类大脑理论上能完成的所有事情。所以这个标准比普通个体人类能做到的要高。后者显然具有非常重要的经济意义,也将是一个重要的里程碑,但在我看来,还不足以称之为 AGI。我们在台上也略微讨论了当今系统所欠缺的,即那种真正具有原创性的发明和思考能力。比如提出一个猜想,而不仅仅是解决一个数学猜想——解决猜想已经相当不错了,但真正像提出黎曼猜想那样级别的猜想,那种数学家们公认极为重要的成果,难度要大得多。还有一致性。一致性实际上是通用性的一个要求,要让顶尖专家都极难在系统中发现瑕疵,尤其是那些显而易见的瑕疵——而我们今天可以轻易找到这些。普通人也能做到。因此,在我们达到我所认为的 AGI 之前,还存在着能力差距和一致性差距。
关于实现AGI的路径,我认为两者皆有可能,而且事实上,我确信两者都会发挥作用。这就是为什么我们在 Scaling Law 和你所说的渐进式改进上投入了难以置信的努力——尽管实际上,即使在这些渐进式改进中也包含大量创新,以持续推动预训练、后训练、推理时计算等整个技术栈的发展。所以,这方面有很多激动人心的研究,我们也展示了其中的一部分,比如那个扩散模型,以及 DeepThink 模型。因此,我们正在这个我们称之为传统技术栈的各个层面进行创新。在此之上,我们还在进行更多 “绿地项目” 的探索,即更具开创性的、“蓝天项目” 设想的项目,比如 AlphaEvolve 或许可以算作此类。“绿地项目” 和 “蓝天项目” 之间有区别吗?我不确定,也许它们非常相似。总之,是一些全新的领域。然后,这些新领域的成果可能会反馈到主要的技术研发路径中。而且我一直——你们都知道——是基础研究的坚定信奉者。我们一直拥有,我认为是所有实验室中最广泛、最深入的研究团队。这正是我们过去能够取得重大突破的原因,显然包括 Transformer,还有 AlphaGo、AlphaZero,以及蒸馏技术等等。如果未来再次需要那样级别的重大突破,我会支持我们去实现它。而且,我们正在探索许多非常激动人心的途径,这些途径既可能带来那种阶跃式的变革,也包含渐进式的进步。当然,它们之间也会相互作用,因为你的基础模型越好,你就能在其之上尝试越多的东西。再次以 AlphaEvolve 为例,就是在 大语言模型 的基础上加入了进化规划。
04 AI的社会影响:教育、陪伴与就业前景
主持人提问:很多人开始思考AGI之后的世界,尤其家长关心孩子应学什么,是否上大学。您如何考虑这个问题?您如何看待目前AI伴侣市场,尤其是那些可能引向不良境地的聊天机器人?Google DeepMind未来会开发此类产品吗?有人担心AI已开始导致失业,尤其对大学毕业生构成竞争,您对此有何看法?
Demis Hassabis:首先,我不会大幅改变一些关于 STEM 教育的基本建议。即使是像编程这样的技能,我仍会推荐学习。因为我认为,无论这些 AI 工具未来如何发展,理解它们的工作原理、功能以及你能用它们做什么,都会让你更有优势。我还会说,现在就应该沉浸其中——如果我是今天的青少年,我就会努力让自己成为精通使用这些最新工具的 “高手”。我认为,如果你非常擅长使用所有最新、最酷的 AI 工具,在某些方面你几乎可以变得像 “超人” 一样。但也不要忽视基础知识,因为基础至关重要。然后,我认为应该教授一些真正的 “元技能”,比如 “学会学习” 的能力。我们唯一能确定的是,未来十年将会发生巨大的变化。那么,一个人该如何为此做好准备呢?什么样的技能对适应这种变化有用?创造力?适应性、韧性。我认为所有这些元技能,将是对下一代而言至关重要的。而且,我认为观察他们会做些什么将会非常有趣,因为他们将是 “AI 原住民”,就像上一代人是伴随着移动设备和 iPad 长大的 “移动原住民” 或 “平板原住民” 一样。再往前,就是我的时代,互联网和计算机的时代。而且,我认为那个时代的孩子们似乎总能适应并利用最新、最酷的工具。而且我认为在 AI 方面,我们还可以做更多工作,让这些工具真正变得更好用。如果人们要在学校和教育中使用它们,我们就应该把它们做得非常出色,并且是可验证的有效。我非常期待能将 AI 大规模地应用于教育领域,并且,如果你能拥有一个 AI 导师,也能将它带到世界上那些教育系统欠发达的贫困地区。所以我认为这方面也有很大的积极潜力。
关于AI伴侣,我认为当开始进入那个领域时,我们必须非常谨慎,这也是我们至今没有涉足的原因,我们对此非常审慎。我对此的看法,更多的是从我们昨天讨论过的 “通用助手” 的角度出发。它应该是一个对你的日常生产力非常有用的工具,能够帮你摆脱那些我们都讨厌做的无聊、单调的任务,从而让你有更多时间去做自己喜欢的事情。我也非常希望这些助手能够通过提供令人难以置信的推荐来丰富人们的生活,比如推荐各种你可能没意识到自己会喜欢的奇妙事物,用惊喜来愉悦你。所以,这些是我希望这类系统发展的方向。实际上,从积极的方面来看,我觉得如果这个助手变得非常有用并且非常了解你,你甚至可以用自然语言来设定它,以保护你的注意力。你可以把它看作是一个为你个人服务的系统,它是属于你的,并且能保护你的注意力不被其他试图攫取你注意力的算法所侵扰。
这其实与 AI 本身关系不大,大多数社交媒体平台实际上就是在做这样的事情,它们的算法试图获取你的注意力。我认为这实际上是最糟糕的情况。如果能够保护好注意力,让我们能更多地沉浸在创造性的心流状态,或者做任何你真正想做的事情,那就太好了。这就是我希望这些系统能为人们带来益处的方式。原因是这样的:你只有一个大脑,假设面对一个社交媒体信息流,你必须深入到那股洪流中才能获取你想要的信息。但你用的是同一个大脑。所以你已经通过深入那股洪流影响了你的思想、情绪和其他事情,去找到你想要的那条有价值的信息。但是如果一个 AI Agent,一个数字助理为你做了这些,你只会得到有用的信息核心,而不需要打断你的情绪、你白天正在做的事情或者你和家人在一起时的注意力等等。我认为那会很棒。
关于AI与就业市场,我不认为目前有任何确切的数据,至少我没有看到。目前,我主要将这些视为增强你能力和成就的工具。我认为,就像大多数情况一样,在下一个时代——也许 AGI 之后情况会再次不同——但在接下来的 5 到 10 年里,我们会发现通常在大型新技术变革中发生的情况:一些工作会被淘汰,但随后新的、通常更有价值、更有趣的工作会被创造出来。我确实认为这在近期会发生。所以,对于今天的毕业生和未来五年内的毕业生而言,情况大致如此。在那之后就很难预测了。那是我们需要为之做好准备的更广泛的社会变革的一部分。
05 AGI最后会改变经济的哪个部分
主持人提问:您认为AGI最后会改变经济的哪个部分?在那些受到严格监管的行业(如医疗保健、教育)推广AI,会更容易还是更难?
Demis Hassabis:治疗是一个非常狭窄的领域,我不太确定。关于这类事情有很多炒作。我实际上不确定有多少这类事情真正在发生,并且实际影响到实体经济,而不仅仅是更像玩具一样的东西。而且我认为 AI 系统目前还没有能力妥善地做到那些。至于那种情感连接,以及我们通过互相交谈和在自然界中、在现实世界中做事情所获得的体验,我不认为 AI 能够真正复制所有那些东西。
关于AI在受监管行业的推广与社会选择,我不知道。也许会,但是我们必须作为一个社会来权衡,我们是否想要所有那些积极的方面,例如,治愈所有疾病或者寻找新能源。所以我认为这些事情对社会显然是非常有益的,而且我们需要 AI 来应对我们其他的重大挑战。社会并非除了 AI 就没有其他挑战了。但我认为 AI 可以成为解决许多其他挑战的方案,无论是能源、资源限制、老龄化、疾病,你能想到的,以及水资源获取等等。我们今天面临着大量问题,包括气候问题。我认为 AI 有可能帮助解决所有这些问题。我同意你的看法,社会需要决定想将这些技术用于何处。同时,我们之前讨论过的产品也在改变,技术将持续进步,这将开辟新的可能性,例如彻底的富足、太空旅行等。这些在今天看来或许有些遥远,除非你读过很多科幻小说,但我认为它们正迅速成为现实。
06
AI创作的作品若缺乏人性挣扎与创作历程赋予的‘灵魂’
主持人提问:在您的生活中,有无某些部分您会坚持不使用AI,即使它可能做得很好,以保护您的创造力或思维过程?当看到AI在您曾投入大量精力的领域(如编程)取得超越性进展时,您是否有过类似Dario Amodei所说的“兴奋与忧郁交织”的刺痛感?尽管VEO或Imagine技术令人难以置信,您是否对其缺乏某种“灵魂”或应用方向感到困惑?
Demis Hassabis:我不认为 AI 现在已经足够好到足以在那些方面对我产生影响。我主要用它来处理一些事务,例如你用 NotebookLM 所做的那样,我觉得效果很好。例如在一个新的科学话题上进行初步探索,然后决定我是否想更深入地研究它。这是我的主要用例之一,还有信息总结等。我认为这些都很有帮助。但是,我们拭目以待。我还没有遇到你所说的那种情况,但是也许随着 AI 变得更强大,会出现的。
关于AI超越人类能力的感受,当然。也许它没有那么刺痛我的一个原因是,我在很小的时候下象棋就有过这种经历。象棋曾是我的第一份职业选择,我小时候为英格兰青少年队下棋,水平相当专业,然后 Deep Blue 出现了。很明显,从那以后,计算机将永远比世界冠军强大得多。但是,我仍然喜欢下象棋,人们仍然喜欢。这不一样,但这有点像 Usain Bolt,我们为他以令人难以置信的速度跑完 100 米而喝彩,但我们有汽车,我们却不在乎这个。我们感兴趣的是其他人类做到这一点。我认为机器人足球和所有这些其他事情也会是这样。这也许可以追溯到我们之前的讨论,我认为最终,我们感兴趣的是其他人类。因此,即使 AI 有朝一日能写出技术上完美的小说,但如果读者知道其作者是 AI,我认为这部作品也不会拥有同样的灵魂或引发同样的共鸣。至少就我目前所能看到的而言。
关于AI创作的“灵魂”,正是如此。这也是我们与 Darren Aronofsky 这样的伟大艺术家以及 Shanker 这样的音乐家合作的原因。我完全同意。我认为这些是工具,它们可以创造出技术上很好的东西。VEO3 的效果令人难以置信。例如,我不知道你是否看过近期一些带有配音并迅速传播的作品。实际上,我没有意识到音频会对视频产生如此大的影响,它真的让视频栩栩如生。但这仍非 Darren——正如我们昨天采访时讨论的——所能带来的那种叙事深度。它缺乏电影大师或顶尖小说家那种深刻的叙事能力。而且,它或许永远也做不到。人们总会觉得缺少了些什么——姑且称之为作品的灵魂,那种真正的人性、伟大的艺术作品所特有的魔力。艺术亦是如此。当我看到梵高或罗斯科的作品时,为何会深受触动?我会不由自主地感到震撼,因为我了解他们所经历的艰辛以及创作过程中的挣扎。梵高的每一笔触都蕴含着他的痛苦。我不确定,即使 AI 模仿了那种意境,而你也知道这一点,这又意味着什么呢?所以呢?因此我认为,至少在未来 5 到 10 年内,这是顶尖人类创作者将始终能够带来的独特价值。这就是为什么我们所有的工具,VEO,Lyria,都是与顶尖的创意艺术家合作完成的。
关于本期对话
访谈发布时间:2025年5月24日
来源:人工智能学家