摘要:北京大学的一个研究团队近日公布了一项名为“AI-牛顿”(AI-Newton)的人工智能系统,它能够在仅输入原始实验数据的情况下,自主推导出经典物理学的核心定律,例如牛顿第二定律。这一进展标志着人工智能在模拟人类科学发现过程方面迈出了重要一步,它不再仅仅是识别数
信息来源:https://www.nature.com/articles/d41586-025-03659-4
北京大学的一个研究团队近日公布了一项名为“AI-牛顿”(AI-Newton)的人工智能系统,它能够在仅输入原始实验数据的情况下,自主推导出经典物理学的核心定律,例如牛顿第二定律。这一进展标志着人工智能在模拟人类科学发现过程方面迈出了重要一步,它不再仅仅是识别数据中的模式或进行预测,而是开始尝试构建抽象的科学概念和数学定律。然而,尽管“AI-Newton”展现了惊人的潜力,但科学家们普遍认为,距离实现能够进行真正自主科学发现、具备类人推理能力的通用人工智能,我们仍有很长的路要走。
从数据到定律:一次概念的飞跃
现代人工智能,特别是大型语言模型(如GPT系列),在处理和生成信息方面已经表现出强大的能力。它们可以从海量数据中学习模式,从而进行翻译、撰写文章、预测蛋白质结构,甚至通过医学考试。但这些成就的背后,是一种基于相关性的“黑箱”式学习,而非基于因果关系的深刻理解。它们能告诉你“是什么”,却很难解释“为什么”。当面对物理世界的基本规则时,这种局限性便凸显出来。
研究人员提供了来自涉及使用钟摆状运动的系统的物理实验的人工智能数据,以查看它是否可以推导出基本物理定律。图片来源:stefilyn/Getty
一个典型的例子是行星轨道预测。2019年,苏黎世联邦理工学院的研究者开发了“AI哥白尼”,它能根据天文观测数据推导出描述行星轨迹的复杂公式。然而,这些公式需要人类科学家去解读,才能将其与行星围绕太阳运行的物理定律联系起来。近期,哈佛大学及麻省理工学院的科学家们使用包括GPT、Claude在内的多个基础模型进行了类似实验。他们发现,尽管这些模型能够被训练来精确预测行星在太阳系中的位置,但它们无法将这些关于轨迹的知识转化为对背后引力作用的正确理解。当被要求推导万有引力定律时,这些先进的模型甚至给出了荒谬的结论。
哈佛大学的计算机科学家Keyon Vafa对此解释道:“经过训练以预测物理实验结果的语言模型,并不会以一种简洁、普适的方式来编码物理概念。相反,它会找到一些非常‘非人类’的复杂方法来近似物理问题的解。” 这意味着,它们学会的是一种模仿,而非真正的领悟。
“AI-牛顿”的不同之处在于其设计哲学。据其开发者之一、北京大学物理学家马彦青介绍,该系统旨在模仿人类科学家的认知过程——通过观察、归纳,逐步构建起一个由基本概念和规律组成的知识库。它采用了一种被称为“符号回归”(Symbolic Regression)的技术。与传统机器学习模型寻找一个能拟合数据的复杂函数不同,符号回归的目标是找到表达物理现象背后规律的最简洁、最符合数学逻辑的方程。系统被编程设计为鼓励其在解决问题的过程中去主动“推断”和“定义”有用的新概念。
为了测试系统的能力,研究团队使用模拟器生成了涵盖46种不同物理场景的实验数据,包括物体的自由落体、碰撞、弹簧振动以及钟摆运动等。为了更贴近真实世界,数据中还被刻意引入了统计误差。当“AI-牛顿”接收到关于一个球在不同时间点的位置数据时,它首先需要为“时间”和“位置”这两个变量之间的关系找出一个数学方程。它成功地自主“发现”了“速度”这一概念,并给出了相应的方程。更关键的是,它会将这个新发现的“速度”概念存储起来,作为后续任务的已知工具。在接下来的挑战中,它成功利用之前学到的知识,结合新的数据,最终推导出了描述力、质量和加速度之间关系的牛顿第二定律(F=ma)。
科学发现的完整链条:AI还缺少什么?
“AI-牛顿”的成功无疑是令人兴奋的。一个能够从原始数据中提炼出普适科学定律的模型,其应用潜力是巨大的。然而,真正的科学发现是一个远比数据分析更为复杂的系统工程。澳大利亚弗林德斯大学的计算机与认知科学专家大卫·鲍尔斯(David Powers)指出,要让人工智能做出自主发现,它需要深度参与到科学研究的每一个环节中去。
这包括:首先,识别出哪些问题是值得研究的、具有突破潜力的(提出问题);其次,设计出能够有效验证或证伪假设的实验方案(设计实验);然后,在实验过程中进行操作和数据采集;最后,才是分析数据、创建假说并验证预测。鲍尔斯强调:“实验科学的关键在于提出感兴趣的变量,并进行系统性的实验来获取数据和验证预测。” 目前的“AI-牛顿”主要聚焦于链条的末端——数据分析与规律发现,而前端更具创造性的环节仍然完全依赖人类科学家。
马彦青也同意这一观点,他坦承像“AI-牛顿”这样的模型距离实现真正的自主科学发现还很遥远。但他认为,这项工作是一个重要的起点,它可以帮助训练未来的人工智能系统如何利用真实世界的复杂数据来发现全新的、更普适的物理定律。他的团队目前正在进行更大胆的尝试:让“AI-牛顿”去探索神秘的量子世界,看看它是否能够从量子实验的数据中揭示出我们尚未知晓的规律。
前路漫漫:从“牛顿”到“爱因斯坦”
从“AI-牛顿”到能够独立进行科学创新的“AI-爱因斯坦”,其间的鸿沟不仅是计算能力的增长,更是关于智能、推理和创造力本质的根本性挑战。它要求AI不仅能处理已知变量,还要能想象出不存在的变量;不仅能遵循逻辑,还要能进行跳跃式的直觉思考和类比推理。
尽管如此,“AI-牛顿”的出现依然为科学研究的未来范式提供了一种全新的可能性。在未来,AI或许能成为科学家的得力助手,从浩如烟海的实验数据中快速筛选出有价值的模式和潜在规律,将科学家从繁重的数据处理工作中解放出来,从而专注于更具创造性的理论构建和实验设计。一个能够自主学习物理学基础的人工智能,即便尚不能做出惊天动地的发现,但它本身,就是一个值得我们深入研究的、激动人心的发现。
来源:人工智能学家