MIT研究发现AI科学家在复杂物理问题上自发达成理论共识

B站影视 内地电影 2025-04-17 15:52 1

摘要:在人类科学史上,不同科学家对同一现象常常提出不同的理论解释。牛顿和莱布尼茨各自独立发明了微积分,爱因斯坦和玻尔关于量子力学的解释存在分歧。而如今,人工智能也日益成为科学研究的重要工具,它们不仅能协助科学家进行研究,甚至也能自行学习新的知识。那么,当两个 AI

在人类科学史上,不同科学家对同一现象常常提出不同的理论解释。牛顿和莱布尼茨各自独立发明了微积分,爱因斯坦和玻尔关于量子力学的解释存在分歧。而如今,人工智能也日益成为科学研究的重要工具,它们不仅能协助科学家进行研究,甚至也能自行学习新的知识。那么,当两个 AI 模型面对相同的科学任务时,它们是否会得出相同的理解,形成同一种理论呢?

来自美国麻省理工学院物理系和人工智能与基础交互研究所(Institute of Artificial Intelligence and Fundamental Interactions)团队的一项研究,给这个问题作出了回答。

相关论文以《两个 AI 科学家会达成一致吗?》(Do Two AI Scientists Agree?)为题发表在预印本平台 arXiv 上。

图丨相关论文(来源:arXiv)

MASS:模拟 AI 科学家的学习之路

为了探索 AI 如何学习物理理论,研究人员开发了一种称为 MASS(多物理 AI 标量科学家,Multiple AI Scalar Scientists)的新型神经网络架构。

MASS 框架的设计灵感来源于物理学中的一个基本原理——最小作用量原理。这个原理表明,物理系统的演化路径总是使其某个称为“作用量”的标量函数取最小值,这个标量函数通常与系统的拉格朗日量(Lagrangian)或哈密顿量(Hamiltonian)相关。许多基础物理理论都可以从这样一个标量函数出发,通过特定的数学运算(如求导)推导出系统的运动方程。

图丨 MASS 的框架(来源:arXiv)

传统的物理学神经网络,如哈密顿神经网络(HNN, Hamiltonian Neural Network)或拉格朗日神经网络(LNN, Lagrangian Neural Network),通常将特定的运动方程(如哈密顿方程或欧拉-拉格朗日方程)硬编码到网络结构中,然后让网络专注于学习标量函数本身。但 MASS 框架采取了更为灵活和通用的策略。它不仅为每个待研究的物理系统学习一个独立的标量函数,我们称之为 S,这代表了对该系统内在规律的初步假设。

更关键的是,MASS 还拥有一个跨所有系统共享的“理论评估层”。这个共享层是整个架构的核心,它负责学习如何从标量函数 S 及其对系统坐标(如位置、速度或动量)的各阶导数中,推导出系统的运动方程。

这种设计赋予了 MASS 学习“元理论”的能力,即学习推导物理定律本身规则的能力,而不是仅仅学习某个特定定律的具体形式。整个工作流程模拟了人类科学家的研究过程。首先,MASS 接收来自不同物理系统的观测数据,例如物体的运动轨迹或状态演化,这相当于数据输入阶段。

接着,对每个系统,MASS 内部的一个独立子网络学习其特定的标量函数 S,这可以看作是假设形成的过程。随后,共享的最终层介入进行理论评估,它对学习到的各个标量函数 S 进行求导等一系列数学运算,并结合可学习的权重,推断出描述系统行为的统一控制方程。这一步骤强制要求 AI 用一套融贯的“理论框架”来解释所有观察到的系统。

最后是改进与泛化阶段,模型将其推断出的运动或状态变化与真实的观测数据进行比较,计算误差,并通过反向传播算法调整网络的所有参数(包括学习标量函数的子网络和学习理论规则的共享层)。这个过程不断迭代,目标是优化出一个单一的理论体系,使其能同时且准确地描述多个不同的物理系统。

通过训练多个具有不同随机初始化的 MASS 模型,研究人员得以模拟不同的 AI 科学家群体,并细致观察它们学习到的标量函数 S 以及最终推导出的理论有何异同。

从简谐振子到混沌双摆

研究团队使用 MASS 进行了大量受控实验。他们首先从经典力学中最基础的模型开始,如简谐振子(Simple harmonic oscillator)和单摆(Simple pendulum),然后逐步引入更复杂的系统,包括开普勒问题(Kepler problem,描述行星运动)、相对论性谐振子,甚至是一些研究人员设计的、没有标准物理解释的“合成”势能系统(Synthetic potentials)。

为了模拟多个独立科学家的情景,研究人员使用不同的随机“种子”(seeds)来初始化多个 MASS 模型实例,然后让它们学习相同的数据集。他们仔细追踪了模型的训练过程、最终学习到的理论(通过分析最终层输出的数学表达式和内部激活 activations)以及这些理论之间的相似性。

在 AI 学习的初级阶段,当它只面对一个非常简单的系统时,比如简谐振子,它确实能够非常准确地预测系统的行为。然而,当研究人员深入剖析其内部形成的“理论”时,发现情况并不简单。AI 有时会学到一种包含大量数学项的复杂表达,其复杂程度远超标准物理理论描述该系统所需。

更有意思的是,不同的 AI,仅仅因为初始随机种子的不同,就可能学到形式上略有差异的标量函数 S,尽管这些不同的函数都能最终导出正确的预测结果。在这个阶段,一些 AI 学习到的理论在形式上更接近物理学中的哈密顿描述(这是一种侧重于能量守恒的视角,通常表达为系统动能与势能之和)。

图丨(a)最终层的权重(蓝色)和平均激活范数(红色);(b)显著激活的相关性(来源:arXiv)

研究中最关键发现来自于逐步增加学习任务复杂性的过程。当研究人员要求 AI 不再只解释单一系统,而是要同时理解并解释简谐振子、单摆、开普勒问题等多个不同物理系统时,情况发生了很大变化。那些原先仅在简单系统上有效、可能包含冗余信息或甚至是“错误”假设的理论开始暴露出局限性,它们无法同时满足来自多个系统的新数据约束。

这个过程非常像自然选择:只有那些更具普适性、更能抓住物理本质的理论,才能在更广泛、更多样的物理现象面前“存活”下来并得到强化。一个有力的证据是,随着 AI 需要学习的物理系统数量的增加,其理论中“显著项”(即对最终预测结果贡献最大的那些数学项)的数量呈现出显著减少的趋势。这清晰地表明,AI 在面对更丰富、更复杂的数据挑战时,倾向于主动寻找更简洁、更核心、更具统一性的解释。

图丨由单个 AI 科学家学习的成对相关性,该科学家在逐步处理越来越复杂的系统时训练(来源:arXiv)

随着系统复杂度的进一步提升,特别是当引入那些在广义坐标(Generalized Coordinates)下描述更为复杂的系统时,AI 学习到的理论展现出一种明确的转变趋势。它们明显地从早期类似哈密顿量的形式,逐渐转向了更接近拉格朗日量(Lagrangian)的形式。拉格朗日量在物理学中通常表达为系统动能与势能之差。

研究人员通过多种方法交叉验证了这一重要发现。一种方法是直接拟合:他们将 AI 学习到的标量函数 S,分别与理论上的拉格朗日量 L 和哈密顿量 H 进行线性拟合,考察其形式是否符合(其中 T 为动能,V 为势能)。结果一致显示,在经过复杂系统训练后,绝大多数 AI 学到的 S 都满足拟合系数 c1 和 c2 符号相反(这恰好对应了拉格朗日 L=T–V 的形式),而不是符号相同(对应哈密顿 H=T+V 的形式)。

另一种方法是进行激活分析:研究人员运用主成分分析(PCA, Principal Component Analysis)等降维技术来处理 AI 最终层的神经元激活值。他们发现,尽管不同 AI 实例(不同种子)的内部激活模式可能千差万别,具体数值差异很大,但它们最主要的激活成分(通常能解释超过 90% 的方差)之间却具有极高的相关性(correlation),其相关系数常常非常接近 1 或者-1(-1 的情况表示一个简单的符号反转,即所谓的“宇称翻转”(parity flip,在物理意义上通常不改变理论本质)。这有力地表明,在功能层面上,不同的 AI 科学家最终就物理规律的核心数学表达达成了一种高度的功能性一致。

此外,研究者还设计了约束优化实验:他们设定了一个优化目标,强制要求 AI 的最终输出必须能够由拉格朗日理论框架下的两个关键数学项 (S⁻¹ᵧᵧSₓ和-S⁻¹ᵧᵧSₓᵧy) 进行线性组合来精确重构。结果发现,在这种严格约束下,重构的拟合效果非常好,R² 值(决定系数,衡量拟合优度)极高。这从另一个角度证明了,AI 在复杂动力学问题上学习到的内在关系,确实是遵循了拉格朗日理论的框架。

图丨拉格朗日量的高 R² 值表明学习到的网络恢复了与解析拉格朗日量相同的函数依赖关系(来源:arXiv)

那么,为什么 AI 会表现出对拉格朗日描述的偏爱呢?研究者推测,这可能与拉格朗日形式本身的数学特性有关。拉格朗日力学在处理广义坐标系时展现出更强的普适性和形式上的简洁性,而哈密顿形式则通常需要依赖更严格定义的“正则坐标”。当提供给 AI 的训练数据是以通用坐标形式给出时,AI 自然会倾向于学习并采用那个更直接适用、约束更少的拉格朗日框架。

最后,为了验证这种方法的潜力,研究团队还将 MASS 应用于更高维度的挑战,即二维的混沌双摆(Double pendulum)问题。众所周知,双摆系统以其复杂的混沌行为而闻名。实验结果显示,即使研究人员没有在 MASS 架构中预先植入用于强制能量守恒的欧拉-拉格朗日方程(Euler-Lagrange equations),MASS 模型也能够通过学习数据,相当准确地掌握并复现双摆那看似无序的复杂混沌轨迹。更重要的是,在模拟过程中,系统的总能量漂移非常小,显示出良好的物理守恒性。这个成功的案例证明 MASS 方法不仅局限于简单系统,而且有潜力被扩展到更高维度、更接近现实世界复杂性的物理问题研究中。

图丨通过 MASS 求解至均方误差为 5×10−3 的双摆轨迹。(来源:arXiv)

“两个 AI 科学家会达成一致吗?”

那么,回到最初的问题:两个 AI 科学家会达成一致吗?这项研究给出的答案是:在很大程度上是的,尤其是在它们面对足够丰富、多样化且具有挑战性的证据时。尽管由于随机性的影响,它们的内部实现细节(例如具体的神经网络权重数值)可能千差万别,就像不同的人类科学家可能有不同的思考路径,但它们最终收敛到的核心物理理论,以及它们倾向于使用的描述该理论的数学框架(特别是对拉格朗日描述的偏爱),表现出高度的一致性。

而且研究结果也突出强调了拉格朗日力学在描述经典系统方面可能具有的某种更深层次的核心地位,至少从 AI 通过数据学习的视角来看是如此。同时,MASS 的成功,或许也能为未来构建可自主发现全新物理理论的系统提供一点启示。

研究人员也提出了几个值得进一步探索的方向,包括探索坐标选择的影响、修改损失函数以研究不同理论的学习机制、尝试不同的模型架构,以及如何有效扩展模型解决更高维问题。

团队希望,他们的工作不仅仅是讲述一个关于哈密顿与拉格朗日两种理论在 AI 学习中竞争与选择的有趣故事,更能为未来构建功能更强大、同时又保持可解释性的下一代 AI 科学家铺平道路。

参考资料:

1.https://arxiv.org/abs/2504.02822

来源:DeepTech深科技

相关推荐