中国科研团队用神经网络破解“核聚变”稳态运行难题

B站影视 港台电影 2025-10-13 16:42 4

摘要:当核聚变研究进入长脉冲稳态运行时代,传统物理模型遇到了计算速度与精度的双重瓶颈。一项发表于核聚变领域权威期刊《Nuclear Fusion》的最新研究显示,基于Transformer架构的深度神经网络代理模型PaMMA-Net,在中国全超导托卡马克装置EAST

当核聚变研究进入长脉冲稳态运行时代,传统物理模型遇到了计算速度与精度的双重瓶颈。一项发表于核聚变领域权威期刊《Nuclear Fusion》的最新研究显示,基于Transformer架构的深度神经网络代理模型PaMMA-Net,在中国全超导托卡马克装置EAST超过一万次放电实验数据上的训练表现证明,人工智能正在为可控核聚变控制系统设计提供全新工具。这一由中国科学技术大学、中科院等离子体物理研究所及科大讯飞研究院联合完成的工作,将磁测量演化预测相似度提升至95%以上,为困扰聚变界多年的快速高精度等离子体演化建模难题开辟了新路径。

托卡马克装置内部的等离子体行为极其复杂。在超过一亿摄氏度的极端温度下,由强磁场约束的等离子体呈现出高度非线性的动力学特征。传统基于第一性原理的物理模型虽然能够从基本方程出发描述等离子体演化,但面对长时程、多变量的实际控制场景时,计算成本往往难以承受。2025年1月,EAST装置刚刚创造了1066秒的高约束模等离子体运行世界纪录,较2023年的403秒记录延长近1.5倍。如此长的放电时间意味着控制系统必须在毫秒级响应速度下持续处理数十个传感器的海量数据流,这对模型的实时性提出了苛刻要求。

PaMMA-Net的核心创新在于将复杂物理过程的建模转化为数据驱动的机器学习问题。研究团队构建的数据集包含磁感应强度、磁通、等离子体电流、环电压、内感、储能、比压和线圈控制电压等多模态输入输出,经过频率统一、缺失补全、标准化与序列裁剪等预处理后,形成了高质量的训练样本。这种大规模实验数据的积累本身就是中国聚变研究长期投入的成果——EAST自建成以来累计进行了数万次放电实验,为数据驱动方法提供了坚实基础。

模型架构采用仅编码器的Transformer设计,这一选择既继承了Transformer在处理序列数据时的强大表征能力,又通过去除解码器结构降低了推理延迟。更关键的是"微变累计预测"策略的引入:与直接预测未来时刻的绝对值不同,模型预测相邻时间步之间的微小变化量,再通过累加得到完整演化轨迹。这一设计的物理直觉来自电磁传感器的测量特性——磁场的缓慢变化意味着相邻时刻的测量值高度相关,预测变化量比预测绝对值更容易收敛,同时也契合了等离子体物理中"平衡态加扰动"的经典建模思路。

在包含860次放电记录的独立测试集中,PaMMA-Net展现出的稳定性令人印象深刻。绝大多数放电样本的预测相似度超过90%,这一精度水平已足以支撑下游应用。研究团队进一步验证了基于预测结果进行平衡重建的可行性——通过数值求解格拉德-沙弗拉诺夫方程,从预测的磁测量数据恢复等离子体边界形状及关键运行参数。重建结果显示,无论是放电的上升段、平顶段还是下降段,模型均能准确捕捉等离子体形态的演化,这证明了代理模型不仅在统计意义上拟合了数据分布,更学习到了支配等离子体行为的内在物理规律。

这种能力的价值在于将代理模型转化为"虚拟托卡马克装置"。传统的控制器设计往往依赖大量真实放电实验进行调试,每次实验不仅成本高昂,还可能因参数设置不当导致等离子体破裂,损害装置部件。DeepMind与瑞士等离子体中心在2022年的合作研究首次证明,深度强化学习算法可以在模拟器中训练出能够控制真实托卡马克等离子体的策略。PaMMA-Net将这一思路推向新高度:作为直接从实验数据中学习的代理模型,它避免了物理模拟器中建模假设可能带来的偏差,为强化学习、模型预测控制等先进算法提供了更贴近实际的训练环境。

具体应用场景包括放电规划优化——在实验前利用代理模型快速评估不同加热功率、磁场配置组合下的等离子体响应,筛选出最有希望的参数集合再投入实际测试,从而大幅降低试错成本。另一个方向是故障诊断与物理机制识别:当代理模型预测与实际测量出现显著偏差时,偏差本身可能指示了模型训练数据中未覆盖的新物理现象或设备异常,为科研人员提供有价值的线索。研究团队透露,这套基于深度神经网络代理模型的研发范式已推广至空分装置工艺优化、大型建筑制冷能耗管理等工业场景,显示出跨领域的迁移潜力。

全球核聚变研究正站在商业化的门槛上。国际热核聚变实验堆ITER项目汇聚了欧盟、中国、美国、日本、韩国、印度和俄罗斯七方力量,计划在本世纪30年代实现Q值大于10的聚变能量增益验证。中国环流三号于2024年首次实现离子和电子温度"双亿度"突破,EAST的1066秒纪录则在稳态运行维度树立新标杆。行业普遍预计,主流托卡马克技术路线将在2035年前后进入聚变堆示范阶段,2050年左右实现商业发电。

在这条通向清洁能源的漫长征途中,控制系统的智能化水平直接影响装置的经济性与可靠性。等离子体的不稳定性——如撕裂模不稳定性、边界局域模等——是导致放电提前终止的主要原因。2024年发表于《Nature》的研究显示,通过深度强化学习实现的预测性控制可提前识别并规避这些破坏性事件。PaMMA-Net提供的高精度代理模型恰好填补了这一链条中的关键环节:它既可用于生成大量虚拟放电数据以训练不稳定性识别模型,又可作为控制策略验证的测试平台,加速从算法设计到实验部署的迭代周期。

当然,数据驱动方法也面临固有局限。神经网络的"黑箱"特性意味着即使预测准确,也难以直接揭示新的物理规律。模型的泛化能力依赖于训练数据的覆盖范围——对于训练集中未出现过的极端运行模式,预测可靠性可能下降。未来的研究方向包括将物理知识显式嵌入网络架构、开发可解释性分析工具、以及探索少样本学习方法以应对实验数据稀缺场景。

从更宏观的视角看,PaMMA-Net代表了AI For Science领域在大科学装置中的深度介入。核聚变研究的复杂性——涉及等离子体物理、材料科学、超导技术、电力工程等多学科交叉——使其成为验证人工智能科学研究能力的理想试验场。这次登上《Nuclear Fusion》的成果表明,中国在将基础模型技术转化为领域专用工具方面已形成完整链条,从大规模实验数据积累、算法创新到工程验证的闭环能力正在加速可控核聚变商业化进程。当"人造太阳"真正点亮人类文明的下一个时代时,智能控制系统或许将是这场能源革命中最不可见却最关键的基石

来源:人工智能学家

相关推荐