摘要:大脑,这个复杂的生物计算机,承载着无数思绪与行为的密码,却始终难以捉摸其完整的面貌。人工智能,这架精密的机器,能够高效处理大量信息。但其思维与反应依然是机械的、预设的,缺乏大脑那种在瞬息万变的世界中游刃有余的适应性。
文 | 追问nextquestion
在纷繁的神经回路与信息流动之间,我们徘徊在智能的边缘,试图捕捉那一抹瞬息即逝的光芒。
大脑,这个复杂的生物计算机,承载着无数思绪与行为的密码,却始终难以捉摸其完整的面貌。人工智能,这架精密的机器,能够高效处理大量信息。但其思维与反应依然是机械的、预设的,缺乏大脑那种在瞬息万变的世界中游刃有余的适应性。
NeuroAI或许能够带来新的契机:神经科学揭示深刻的计算与认知之道,为人工智能提供灵感;而人工智能作为神经系统的模拟,又推动着我们对大脑结构与功能的理解,仿佛一场永不停息的互动,彼此促进,交织成一个良性循环。
在卡内基梅隆大学保罗·米德布鲁克斯(Paul Middlebrooks)主持的这场跨越学科与思维的对话中,我们将与冷泉港实验室(CSHL)生物学与神经科学系主任安东尼·扎多尔(Anthony Zador)教授一同探索这一议题。或许,在其中,我们能找到照亮未来的那一束光——不仅是为人工智能铺路,更是为我们如何理解自身的存在,寻找出一条新的路径。
安东尼-扎多尔
Anthony Zador
冷泉港实验室(CSHL)生物学与神经科学系主任
美国神经科学家,2015年被《外交政策》杂志评为全球百大思想家。在神经科学与人工智能交叉领域方面,他是 2004 年计算与系统神经科学 (COSYNE) 顶会以及NAISYS(神经科学到人工智能系统)会议的联合创始人。目前,他的实验室主要研究大脑神经回路如何产生复杂行为,包括听觉皮层如何处理声音等。近期他开创了一种连接组映射的分子生物学新方法,显著提升在单细胞水平上映射神经元回路的速度。冷泉港实验室,有132年历史,为享誉全球的非营利性私人科学研究与教育中心,主要成就为分子生物学领域,共诞生8位诺贝尔奖得主,被誉为世界生命科学圣地、“分子生物学摇篮”,名列世界影响最大的十大研究学院榜首。
保罗·米德布鲁克斯
Paul Middlebrooks
卡内基梅隆大学特聘助理研究员、
播客“Brain Inspired”主理人
卡内基梅隆大学特聘助理研究员,他研究运动皮层和基底神经节神经群体活动如何在大鼠的自然行为中起作用。播客“Brain Inspired”主持人。此前在匹兹堡大学Marc Sommer实验室获得认知神经科学博士学位;在范德堡大学的Jeffrey Schall, Geoff Woodman, and Gordon Logan实验室从事博士后研究。
01 NeuroAI与研究生涯Paul Middlebrooks:你觉得NeuroAI这个术语怎么样?你喜欢这个术语吗?
Anthony Zador:起初我对这个术语并不感冒。事实上,大约五年前,我在冷泉港与凯特·唐纳德森(Cat Donaldson)合作,他尝试帮助我构建一个结合神经科学与人工智能的项目。在这个过程中,我们讨论了许多不同的想法。当时,我在提案中使用的是一些更复杂的描述,例如“神经科学与人工智能的交集”。凯特认为这样的表述太过笨拙了。几周前,我在谷歌学术上进行了搜索,想要确定这一术语最早出现的时间。结果显示,直到2010年代中后期,这个术语的使用频率才开始显著增加。虽然有一些早期的使用实例,但它们通常指的是脑机接口相关的概念。
Paul Middlebrooks: 你在长期观察和研究的过程中,逐步接受并对NeuroAI越来越感兴趣。是什么让你如此兴奋呢?
Anthony Zador:回顾我的学术旅程,在80年代末到90年代初期的研究生时期,我对计算神经科学和人工神经网络的领域充满热情。在那个时候,这两个领域是紧密相连的,几乎可以看作是一枚硬币的正反面。这个领域的核心思想是,通过构建神经回路如何进行计算的模型,来提炼我们对神经回路工作原理的理解,并将这种理解应用到构建更好的人工系统中。
在我刚涉足这一领域时,计算神经科学和人工神经网络之间并没有明确的区分。它们在许多方面是交织在一起的,这让我感到非常兴奋,因为神经科学中有着长期使用定量模型的传统,而这也正是计算神经科学的核心部分。尽管如此,传统的神经科学模型往往并没有充分认识到,神经回路不仅具有动态和行为特征,还必须执行某些功能。这些回路必须使得嵌入其中的有机体能够解决实际问题。
正是这种对神经回路功能的认知限制,最终促使了计算神经科学与神经网络的早期结合。那时的我或许有些天真,但我认为,当时很多从事视觉科学研究的人并没有真正意识到,从神经回路角度解释视觉信息的处理机制是非常复杂的。就像早期的计算机科学家以为计算国际象棋的下棋步骤很难,但让计算机控制机器人手臂去拿棋子很简单一样。这种想法在后来的实践中被证明是错误的。
我从赫贝尔(Hubel)和韦伯尔(Wiesel)的工作开始,跟随其研究方向,逐步理解了这种认知转变。早期的视觉研究集中于在大脑不同区域识别视觉场景的表现形式,并认为这可以帮助我们解释视觉感知的机制。然而,随着研究的深入,我们逐渐认识到,单纯的寻找视觉场景的表征,并不足以解释整个视觉过程的复杂性。
Paul Middlebrooks:所以你对NeuroAI的兴趣,来自于对问题复杂性的重新认识吗?
Anthony Zador:在我读研究生时,我认为自己能够同时深入学习神经科学的知识,同时将这些知识应用到构建更好的人工系统中。那种想法充满了无限的可能——不仅能理解大脑如何工作,还能借此推动机器智能的发展。
然而,随着研究的深入,我逐渐意识到,自己无法同时兼顾这两个目标。在完成博士后研究时,我做出了一个决定:必须专注其中一个方向。那时,我发现自己对神经网络的研究兴趣开始有所减退。相比之下,神经科学领域提供了更多的机会,让我能够进一步深入学习,了解大脑的工作原理。于是,我决定重新调整自己的研究方向,专注于神经科学的实验研究。
这种转变让我成为了一名纯粹的实验研究者,或者更准确地说,一位受到理论和计算问题驱动的实验者。在博士后期间,我的研究重点转向了突触生理学,这一领域为我提供了更广阔的探索空间。尽管如此,我依然对定量方法保持浓厚的兴趣。在那个时期,我对信息论的技术感到非常兴奋,尤其是由比尔·比亚莱克(Bill Bialek)等人开创的一些信息理论方法,这些方法为理解神经系统的工作机制提供了全新的视角。
02 神经科学与信息理论Paul Middlebrooks:那今天你怎么看待信息理论方法?
Anthony Zador:在我思考问题的过程中,信息测量是我方法论的核心。很多像我一样的研究者都在从事信息测量的工作,而这一过程对清晰思考神经元如何表示信息以及它们的表现能力非常有帮助。
尽管信息测量有其局限性,但我认为它提供了一个强大的框架,有助于理解神经回路是如何处理信息的。虽然从中得出的具体数字往往显得单调且乏味,甚至有些人对此表示批评,然而,对我来说,真正引人入胜的是背后的框架和思考世界的方式,这包括了信息必须被传播和转化的认识。
过去我们很多人更关注感觉处理,在这方面信息理论涵盖了如何从外部世界接收信息并进行表征。但直到我自己开设实验室时,我才真正意识到动物的行为是不能被忽视的。
在过去,许多研究都是在麻醉动物上进行的,因为在麻醉状态下,实验相对容易控制,研究者可以通过这种方式研究神经回路的基本功能。然而,麻醉动物的行为通常比较单一,也缺乏自然性。因此,麻醉动物研究取得的结果,虽然为神经科学的发展提供了基础,但也限制了我们对神经系统在实际行为中的作用的深入理解。
我的实验室工作,让我开始探索动物在更自然状态下的行为,这不仅改变了我的研究方向,也对整个领域的研究方法产生了影响。
03 神经科学的实验路径与局限性Paul Middlebrooks:在神经科学研究中,许多时候人们会提到像麻醉动物这样的历史性实验,并认为这些实验是我们今天能够取得现有成果的必要步骤。人们通常认为,麻醉动物的使用为后来的动物模型多样化、以及在控制实验和自然状态下进行研究铺平了道路。动物麻醉实验是否真的起到了如此关键的作用呢?
Anthony Zador:历史上,许多哲学家曾探讨过某条历史路径是否必然。我不确定这一路径是否真的是必然的,但直到今天,依然有一些实验是基于某种假设的。
以我自己的经历为例,做博士后时我做了很多脑切片实验。脑切片的做法比使用完整的大脑来得更加可行,可以让我们得到许多在完整大脑操作下难以获得的信息。一个有趣的现象是,当神经科学家提到“在体操作”(in vivo prepare)时,大多指的是大脑仍处于颅内状态的实验。而如果生物化学家提到“在体操作”,指的则是细胞膜完整、其内各种蛋白质未变质的实验。
不同的实验操作,适合不同的问题。我从不批评任何一种实验操作,也不会否定某种研究路线。但问题在于,如果整个学术圈都忘记了实验操作只是模型,而非现实的全部表现,问题就出现了。
当一个社区发展到足够大的规模,它开始局限于内部对话,而那些原本与整体研究目标相关的问题也会脱离原本的框架,开始自我发展。我认为,大多数研究者在开始职业生涯时,并不会专注于研究麻醉的猫脑中的静态视觉图像。这个问题当然非常有用,它也为许多人提供了一个共同的研究模型。但我认为这并不是推动所有人从事这类研究的核心驱动力。这个除了实验模型还有更大问题需要解答:例如,如何表征外部世界?这些视觉表征是如何被动物使用的?或者,什么是思维?这些才是最初驱动研究的深层问题。
04 NeuroAI与人工智能的发展Paul Middlebrooks:在你看来,现代深度学习和NeuroAI的方法是否可能犯了与传统神经科学研究类似的错误——即把模型或抽象的表征与它们所代表的现实相混淆?比如有些人认为,“Transformer模型能进行认知处理”的说法可能是一种过度简化,Transformer只是一个模型,并不等同于真正的认知过程,它也不是最终的答案。尽管这个模型可能比之前的模型更接近真实的认知处理,或许更有潜力。你怎么看待这种说法?
Anthony Zador:我甚至可以说,根据我目前的了解,Transformer几乎可以作为NeuroAI成功的反例,它与我期望从大脑中发现的任何东西几乎没有相似之处。它们的成功基本上来源于这样一个事实:它们与当前一代的GPU硬件非常匹配。
ChatGPT的成功展示了语言作为一个封闭系统的特性。ChatGPT虽然在处理语言任务时表现出色,能够提供合理的答案,但它并不是完美无缺的。比如,它无法进行准确的算术计算。这并不是对它的否定。因为运作方式与传统的算术算法不同,ChatGPT给出的合理答案通常是基于语言的结构和模式,而不是通过实际的数学计算方法。尽管如此,ChatGPT在给出合理语言答案方面的能力仍然令人惊叹。
我们在进化过程中形成了很多能力,其中语言能力获得的时间并不长,大约在过去几十万年,甚至最多一百万年才出现。而其他更早形成的能力,尤其是感知和行动,才是人工系统目前依然非常难以复制的部分。
Paul Middlebrooks:我想讨论的模型应该是那些更加关注模拟大脑认知过程的神经网络模型,比如那些通过卷积神经网络和递归结构来模拟和理解大脑信息处理机制的神经网络架构,以及它们在理解大脑方面的推动作用。
Anthony Zador:在NeuroAI的支持者中,卷积神经网络(CNN)常常被作为例子引用。其实,除了卷积神经网络之外,还有一个更根本的例子,那就是神经网络本身——通过大量连接的元素、具有可变参数的网络进行计算。如果没有从大脑的抽象模型中得到的启发,我们可能根本无法想到这一点。
当谈到NeuroAI的未来发展时,一个常见问题是:人工神经网络是否仅仅是受到了大脑的启发,而不是对真实大脑神经的模仿,就像鸟类启发了飞机的设计而不是直接模仿鸟类的飞行方式。对此,杨立昆提出反论,指出航空工程师确实从鸟类的飞行中获得灵感,这一点他显然已经研究过。不过,我自己对此持中立态度,并愿意尊重他的见解。
我认为更关键的问题是,人工智能的目标究竟是什么。如果我们的目标是创造一种尽可能接近人类智能的系统,那么仅仅实现功能上的高效是不够的。飞机虽然可以完成鸟类无法实现的任务(如远距离飞行、运载货物),但它不具备鸟类在自然环境中的灵活性,比如在森林中安静地飞行,或者从水中俯冲捕捉鱼类。同样,计算机也能做很多人类无法做的事情,比如快速计算、检索查询等——但这不是我们真正追求的目标。
如果我们的目标是实现人工智能——即让机器能够完成任何人类可以做到的事情,那么我们就应该研究人类如何完成这些任务。要理解人类如何完成复杂行为,最直接的途径是观察其他动物的行为,因为人类的许多能力并不是全新独立的,而是继承了祖先的生存能力。因此,研究动物如何感知、适应和行动,可以帮助我们更好地理解人类行为的核心机制。
05 NeuroAI与目标函数对齐Paul Middlebrooks:我曾私下问过你,什么事情让你感到兴奋。你提到了“对齐”,说目前我们在强化学习等领域设计目标函数的模型非常有限,我们应该从动物身上汲取灵感来解决这个问题。
Anthony Zador:是的。我特别关注如何从生物学和神经科学中获取启发,并将这些启发应用于人工系统。其中,最根本的问题是对齐(alignment)。
目前,我们擅长构建能够优化单一明确目标函数的系统。然而,当涉及多个目标时,我们通常的解决方案是将它们简单地加权求和。但大多数情况下,这种扩展并不稳健,实际效果也不好。
相比之下,经过进化的动物很擅长平衡多重目标。在面对“觅食、逃生、战斗和繁殖”这四个基本目标时,动物能够根据环境动态调整它们的优先级。例如,当饥饿时觅食是首要目标,但如果遭遇捕食者,逃生会立刻取代觅食成为最高优先级。而浪漫(繁衍)通常只会在其他三种需求满足后才被考虑。
这些顶层目标还可以被分解为子目标和更小的子子目标。对于人类和其他社会性动物来说,社交目标与饥饿等生理需求同样重要且深远。生物体通过进化形成了一种架构,可以引入新的目标,同时确保这些目标与现有目标能够合理互动。
然而,我们目前并不完全理解这种生物学机制是如何实现的,暂时无法在人工系统中实现类似的功能。这是一个值得深入研究的领域,它可能为人工智能设计提供重要的启示。
Paul Middlebrooks:认知架构曾经是人工智能研究的一个重要方向,至今仍然很重要。但在尝试构建这些系统的过程中,人们发现,模块之间的协调问题,比模块内部的每个目标函数更为复杂和困难。
Anthony Zador:我完全同意。事实上,我认为NeuroAI是一个良性循环,在这个循环中,我们从神经科学中汲取启发,将其应用到人工智能中,同时又用人工智能作为神经科学的模型。
就像视觉科学家,将那些模糊的理论应用到实际系统中时才意识到视觉的复杂性。我认为,研究动机的学者们也未必明白,协调多重目标是多么困难。我们要真正理解从具备多个目标的智能体中生成行为的难度,必须开始尝试构建这样的智能体。这将帮助我们更好地定义问题,甚至对实验学者来说也是如此。
目前,在实验层面,我们仍在努力定义什么是奖励信号,这些工作虽然很重要,但它们未必能够帮助我们直接解决协调多个目标的难题,这可能是最棘手的挑战。
Paul Middlebrooks:这其实回到了一个问题——你希望人工智能系统做什么?我认为,复制我们人类的方式可能不是构建人工智能的最佳途径。为什么要让一个系统具备我们在人类进化过程中辛苦获得的那些复杂协调机制呢?我们有很多不同的目标函数,它们之间可能会发生冲突。但是为什么要让人工智能去应对这种复杂性,去实现这些目标呢?
Anthony Zador:因为我期望的是一个功能多样、能够在特定环境下进行智能决策和应对的机器人,既能完成常规任务,又能确保人的安全并在紧急情况下做出合适的反应。
实际上,我们希望机器人遵循的具体目标,最终可能会与我们人类的目标大不相同。关键不在于这些目标的内容,而在于如何设计一个计算框架,能够让机器人在不同目标之间做出合理的权衡。
对人类来说,生存显然是个重要目标。但这个目标也可以放宽。比如,蚂蚁中的个体其实并不太关心自己的生死,它更关心的是整个蚁群的利益。蚂蚁作为蚁群的一部分,愿意为群体的利益做出牺牲。虽然蚂蚁也会考虑个体的生存,但它并不会将生存作为最核心的目标。同样的道理也适用于机器人。我们不希望机器人做出危险行为,比如“随意走进熔岩坑”。但我们也不希望机器人死板地遵循阿西莫夫的三定律——“机器人不得伤害人类,或因不作为而让人类受到伤害”,“机器人必须服从人类的命令,前提是这些命令不与第一定律冲突”,“机器人必须保护自己,只要这种自我保护不与前两条定律相冲突”。
个体生存和不伤害他人等原则固然重要,但这些规则可能不足以应对现代技术和现实应用中的复杂情况。我们需要为机器人设计更复杂、灵活的伦理框架,而这种框架可能不仅仅依赖于明确的规则,而是可以通过自然语言处理等技术,使机器人能够根据不同情境动态调整行为。
Paul Middlebrooks:那你希望机器人具备情感功能吗(比如浪漫)?
Anthony Zador:我并不想要浪漫功能。但必须承认,浪漫是推动技术发展的一个重要因素。私人浪漫题材的电影是VHS录像带普及的主要推动力之一,这种私人浪漫题材的需求也影响了早期互联网的发展。这种技术和文化需求之间的密切联系,尤其是在情感和个人隐私方面的需求,往往是推动技术快速发展的一个重要因素。
06 发育、基因压缩表示与进化Paul Middlebrooks:我在很早的一期节目中采访过你,当时我们讨论了你的一篇论文,论文中你提出,大多数有用的能力实际上是由进化逐渐赋予的,是与生俱来的。现在你依然坚持这个观点,但同时你也开始关注发育,认为这是一个值得研究的领域,尤其是从如何理解目标函数协调的角度来看。你对发育的兴趣与目标函数的协调性有关系吗?
Anthony Zador:没错。我对这样一个观点感到非常兴奋,即所有行为——无论是动物行为还是人类行为——都来源于深层的先天驱动力,这种驱动力存在于每个层面。
我们没有足够的时间从零开始学习所有的东西。学习可以被看作是发展过程的延续和扩展。有这样一个观点:我们的许多神经回路和行为大部分是由基因决定的,基因规定了这些神经回路。那就意味着我们必须关注基因与最终形成的大脑之间的关系。生物学将基因转化为大脑的过程被称为“发育”。
最初我认为可以忽视发育的生物学过程,但后来我意识到,我之所以忽视它,是因为我对发育知之甚少。发育过程非常有趣,里面有很多可以抽象的原则,这或许能够帮助我们更好地解决问题。举个例子,发育的核心原则之一是,通过递归地应用一组相对简单的规则,大脑从单一细胞发展成复杂结构,这些规则在必要时会随着发育过程的推进而进行调整。
Paul Middlebrooks:Robin Hiesinger等研究者专注于大脑发育研究,他提出了一个观点,即我们的DNA没有足够的编码容量来指定人类大脑的完整结构。他认为DNA并不直接编码大脑的每个细节,而是编码了必需的递归规则。DNA无法直接跳跃成一个成型的大脑或计算机系统,因此发育过程是必须的。你怎么看待这个观点?
Anthony Zador:我非常认同,我曾经认为基因组是我们神经回路的压缩表示,它代表了一种“基因瓶颈”。最近我们刚刚发布了一篇论文,首次尝试严格地阐述这个想法。这篇论文四年前就已在bioRxiv上发表了,最近终于在PNAS上正式发表。这项工作是与我的同事亚历克斯·库拉科夫 (Alex Kulakov)教授共同完成的。
▷Shuvaev, Sergey, et al. "Encoding innate ability through a genomic bottleneck." Proceedings of the National Academy of Sciences 121.38 (2024):e2409160121.
在这项研究中,我们提出了使用一个更小的神经网络来压缩一个大神经网络的权重矩阵。这个过程并不是一个典型的自编码器。具体来说,我们有一个N×N的权重矩阵,包含N²个元素,然后用一个更小的神经网络,输入是矩阵中的两个索引,输出是对应权重的预测。
这个方法取得了很好的效果,我们成功地将MNIST、CIFAR和ImageNet的数据集中的大矩阵压缩了100倍甚至1000倍,而压缩后的矩阵几乎能够保持与未压缩矩阵相同的表现。更重要的是,我们还发现,压缩后的表征提高了迁移学习的效果,这表明压缩过程中去除了冗余信息,保留了重要部分。我们可以将压缩视为一种正则化方法,这也得到了验证。
最近和布雷克·理查兹 (Blake Richards)的合作中,我们受到不同想法的启发,提出一个新的压缩方法,已经在bioRxiv上提交审核。这项研究可能要六年后才能发表。我们在这个版本中使用了细胞类型以及细胞类型之间的随机连接性。我认为这两个研究不仅充满乐趣,也让我学到了很多东西。
▷ Lachi, Divyansha, et al. "Stochastic Wiring of Cell Types Enhances Fitness by Generating Phenotypic Variability." bioRxiv (2024):2024-08.
目前我与博士后斯坦·克尔斯廷 (Stan Kerstjens)一起研究的课题,关注如何通过递归方式来形成发育过程,如何利用非常简单的规则来发展一个网络。这个网络在发展过程中可以被引导最终解决任务。在我看来,这捕捉了发育中的一些关键元素。这些递归规则代表了一种“先验”,即对可能生成的神经回路的一种约束。任何用于压缩的规则,实际上都在对可以生成的回路施加一个先验。比如网络生成的回路及其学习速度,实际上是在对生成的网络类型施加限制,为这些网络类型提供了一种先验。
Paul Middlebrooks:限制就像协调问题一样。限制无处不在,从某种意义上说限制比过程本身更为重要。
Anthony Zador:是的。有些人认为,人工神经网络的成功在于它们能够表示出数据的平滑先验,这得益于大量相关研究。同样,你无法预知什么是正确的限制或先验,这都需要通过实验验证。
神经网络的先验与实际神经回路的形成过程非常相似。每个生物体的神经回路都是从一个单一细胞开始形成的,而把一个细胞发展成多个细胞的规则必须能够被基因所编码,这可能就是关键的限制之一。总的来说,我现在对此非常兴奋,我们可以看看未来会如何发展,但我觉得这是正确的方向。
关于进化,也有一个很自然的解释。进化实际上是在产生神经回路。初始的回路在执行某些行为时非常有效。这个回路存在于某个生物的大脑中,使得该生物能够执行一些行为。接下来进化会选择那些行为表现好的个体,在下一代中这些能力可能会得到发展。如果发育的规则使得动物的神经回路在某种行为上更加高效,那么进化就会选择它们,在现有回路的基础上加入新的能力和新的回路,但必须确保每一代都能产生具有执行所有所需行为的大脑的生物。
Paul Middlebrooks:那么,为什么需要发育呢?
Anthony Zador:发育过程对于生物学至关重要,因为它从单一细胞出发,生成了一个具有高度复杂性的生物体。尽管我个人更关注大脑的发育规则,但机器人学的研究也不能忽视“身体”的构建,因为机器人不仅需要智能系统,还需要一个与外界环境交互的身体结构。如果我们想理解机器人技术,我们需要认识到身体的构建过程与大脑发育类似。
07 机器人技术与课程学习Paul Middlebrooks:你之前提到过对研究发育过程的迟疑,我也能理解这种感受——这个过程看起来非常复杂和困难,这确确实实让我感到害怕。我想,人工智能领域可能也不太愿意考虑发育过程,或者说他们认为生物体是从细胞阶段发展才需要经历发育过程,而这对于AI的构建可能没有太大帮助。
Anthony Zador:我最近一直在思考一个问题,我们在这方面还没有取得什么进展,所以我就只是分享一下我的研究想法。
最近,我在思考机器人技术。目前的机器人并不够优秀,它们在与世界互动方面的表现远远不如人类。有一段时间有一些研究者对物理模拟器非常感兴趣,我自己也尝试过像MuJoCo这样的模拟器。
在这些物理模拟器中,你可以指定一个有手臂和腿的智能体,它们通过像肌肉一样的东西连接在一起,你可以对它们施加力,然后在这些虚拟环境中学习控制策略。然而,即便在这些简化的物理模拟器中,创建能够走路的简单智能体也非常困难。
我和我的团队也做过一些尝试,其他许多研究人员也在这些模拟器中做了很多工作。我的理解是,机器人学家在模拟环境中花费了太多时间,但是将模拟中的智能体转移到现实世界中通常是行不通的,这就是所谓的“模拟到现实”(sim-to-real)问题。
在这方面,我的思考是:我们人类也面临着类似的“模拟到现实”问题。我们的基因组指定了一个身体和一个神经回路,而身体的设置不一定与神经回路的设置紧密相关。但是当我们出生时,我们的大脑必须迅速学习如何控制我们出生时所拥有的身体。
Paul Middlebrooks:我想到一个例外情况。我最近和卡伦·阿道夫 (Karen Adolph)讨论过,她专注于人类运动发育,研究了很多关于儿童的运动发展。她发现,儿童在学习运动技能的过程中,摔倒和撞到东西的频率非常高,因为他们正在积极探索这个空间。孩子们不像马那样,出生几分钟就能走路。所以相比之下,我们人类的发育要慢得多。
Anthony Zador:这是一个很好的问题。为什么我们需要花费很多时间才能学会走路?我认为很明显,这并不是因为我们不能更快地学会走路。当我的孩子很小的时候,我希望他们能慢一些学会走路,因为如果他们没有足够的常识就很容易遇到危险。
孩子们刚开始学走路的那段时间,他们已经具备了走动的能力,但还没有足够的判断力,就好像他们可以拿东西放进嘴里,但还不懂得分辨什么东西应该放进去,什么不应该。这段学习如何站立的漫长过程,可能正是因为那些过早学会站立的孩子,往往做出了一些错误的决定。
说到动物,我想举个例子:你可以让一只吉娃娃和一只大丹犬交配。因为从基因角度看,它们的DNA是兼容的。这告诉我们,尽管它们的体型差异大得惊人,但他们的大脑发育指令几乎是没有区别的。这个例子展示了生物体具有惊人的灵活性和适应性。与之相反的是,在MuJoCo这样的物理模拟器中训练一个模拟智能体控制身体,如果改变身体的10%到20%,它就无法正常运行了。
我认为,生物的这种现象的背后是一个发育过程。在这个过程中,发育的每一步都解决了整体大问题中的一个子问题,使得大脑和身体的组合能够在几个月,甚至几周内学会走路和跑步。这个过程对于所有动物都是如此。这种发育过程并不是一蹴而就的,而是一个通过不断解决小问题逐步积累的过程。
Paul Middlebrooks:这让我想起了你提到的课程学习(Curriculum Learning)这个概念。我理解的课程学习是指通过逐步学习来掌握一项技能,而不是一开始就去做整个复杂的任务。比如我们用网球发球作为例子,你并不是一开始就直接去做完整的发球动作,而是先学会如何站立,学会如何弯曲膝盖,然后分开练习这些动作,最后再将它们组合在一起,完成整个发球动作。这就是课程学习的方式。最近,亚历山大·马蒂斯 (Alexander Mathis)也在讨论类似的内容,他提到这种方式实际上有助于教导人工系统如何学习类似的任务。我猜这也是你刚才所说的意思。
Anthony Zador:没错。机器学习中确实有很多关于课程学习的研究。通常人们认为课程学习的挑战在于很难选择一个合适的课程。举个例子,如果你的目标是训练一个图像识别系统,并且目标是尽可能加快训练速度,那么课程学习的作用就不太明显了。你可能会猜测哪些基本模块有用,但等你尝试了很多种课程设计后,可能直接使用数据进行端到端的训练会更高效。
在我看来,课程学习真正有用的情景是,当你需要反复解决相似的问题,但是每次面对的约束条件、问题表述、甚至是“大脑”和“身体”都有些许不同时。在这种情况下,课程学习就能够发挥重要作用,因为它能够帮助系统逐步适应不同的变化。
Paul Middlebrooks:你的思路让我想到了一个例子:婴儿爬行时,刚开始它甚至连抬头的方式都不同,它看到的东西也不同。随着它能坐起来并且能更好地移动时,它的世界观和信息处理方式就发生了变化,它开始关注不同的事物。当它开始走路时,它的观察和行动能力又变得更加复杂。这是不是你在说的意思?也就是说,从婴儿发育的过程当中汲取灵感,因为它们在不同阶段解决的是不同的问题。
Anthony Zador:没错,婴儿在不同的发育阶段解决的是不同的问题,而每一个问题的解决都为下一个问题的解决提供了基础。这正是进化的作用所在,进化在某种程度上为问题的解决顺序提供了指导。进化并非是随机的,而是在长期的适应过程中,为每个阶段的问题提供了解决的顺序。
马克斯·贝内特 (Max Bennett)写了一本关于智能简史的书,提到“五个突破”这一概念,虽然他不确定这是否完全准确,但它提供了一个很好的框架,帮助我们思考问题。这个框架的核心思想是,只有在达成第一个突破后,才能进入第二个突破。
他提到了一句老话:“个体发育重演进化过程(ontogeny recapitulates phylogeny)”,这句话包含了一个很有道理的经验法则。它的意思是,个体的发育过程在某种程度上反映了物种的进化历程。换句话说,发育在某种程度上重演了进化的历史。
具体来说,动物一出生就能执行一些重要的行为,因为这些能力对生存至关重要,因此它们天生就具备这些技能。之后,动物会学习其他有用的技能,而那些能快速学习新技能的个体会在进化中被优先选择。最快的学习方式其实是直接将这些技能嵌入基因中,这样就不需要通过后天学习来获得它们,或者至少尽可能地将这些信息传递到基因里。
这也解释了我之前所说的,发展和学习之间的界限非常模糊。简单来说,你学习某件事情的速度越快,意味着你已有的先验知识越强,学习这件事所需的外部信息就越少,而这一切都是通过将这些知识编码到基因中来实现的。
Anthony Zador:我认为,在人工智能的训练中,课程学习可以提供前进的方向。具体来说,我们可以在模拟环境中探索什么是合适的发育过程。选择一系列需要学习的子任务,然后将这些任务分解成更小的问题。如果这个合适的课程存在,我们希望学习这些子任务所花费的总时间会比直接学习最终目标所需要的时间更短。例如,假设目标是让智能体学会走路,那么分阶段学习这些子任务应该比从头到尾一次性学习走路更高效。
接下来,如果这些子任务相对简单且有序,我们就可以尝试将同样的开发课程应用到实际的智能体上,尽管它仍然需要适应身体结构上的差异——比如模拟环境中的身体和现实中身体之间的不同。如果我们能把这些差异分解成更小的部分,那么它们可能会比直接从头到尾进行端到端训练时所面临的差异要小,从而使学习过程更加高效。
08 编译后记Yin Ava:NeuroAI,理论上是一个相互促进、交织成循环的体系,神经科学的探索与AI的进步能够相辅相成,共同推动智能的边界。然而,现实却并非如此简单。神经科学在启示AI方面有哪些局限性?如何促进从神经科学研究中获取灵感启发AI?
神经系统的复杂性和多样性尚未完全被理解,神经科学在提供启示时还缺乏统一的理论框架;现有的神经科学实验方法(如麻醉动物实验)也无法完全反映大脑在自然状态下的行为和信息处理过程;况且,神经科学与AI的研究语言和目标存在差异,两者的融合尚未达到最优状态。如何促进神经科学对AI的启示,突破这些局限,需要更加深入的探讨与思考。
如果这些局限无法突破,是否意味着神经科学在启发AI方面的意义就会消失?或许我们可以从不同的角度来审视这一困境。即便神经科学的现有局限性使其在某些方面无法直接为AI提供有效的指引,这并不意味着其启示作用就全然失效。相反,这些局限本身也许正是推动思考与创新的契机。
AI的设计不仅仅是对大脑功能的单纯复制,而是对神经系统的深刻理解与重新构想。如果神经科学无法提供明确的答案,那么它是否能够激发我们对智能的本质、感知的复杂性、以及学习的机制等更为深刻的思考呢?在这种意义上,神经科学或许并非仅仅为AI提供现成的答案,而是引发一系列新的问题与探索路径。局限并非终结,反而可能是新的开始。
为提升阅读体验,本文对听稿进行了适当地编辑。原采访指路:
来源:钛媒体