摘要:DeepMind强化学习专家David Silver提出:“AI要像婴儿一样,通过“体验”,主动学习。”
在海德堡获奖者论坛上,人工智能与物理科学的交汇引发关注。
DeepMind强化学习专家David Silver提出:“AI要像婴儿一样,通过“体验”,主动学习。”
这会是人工智能摆脱人类经验依赖、进军自然科学的转折点吗?
物理实验代价高昂,强化学习“试错”的代价是否太大?
粒子物理学家西娅·克莱博·奥雷斯塔德(Thea Klaeboe Åarrestad)在论坛上提到,当大型强子对撞机(LHC)运行时,AI如果用于控制质子的路径,一旦出错,可能会导致粒子撞击异常,带来不可逆的后果。
这样的风险,显然不是强化学习可以随意“尝试”的场景。
这也正是强化学习在实际物理系统中应用的一大“坑”。
不像围棋或电子游戏,物理实验的代价是时间和金钱,甚至是实验设备的安全风险。
现有的物理理论已经非常精确,例如在高能物理中,许多物理量的预测误差已控制在极小范围内。
那么,强化学习从零学起,意义何在?
凯尔·克兰默(Kyle Cranmer)认为,在大气流体动力学这些缺乏完善的理论模型的系统,强化学习可能比传统方法更有效率。
不是所有地方都需要AI去“重建理论”,但在建模困难、系统复杂的领域,强化学习可能补上那些人类无法精确描述的“空白”。
强化学习需要大量交互数据来训练模型。
而物理实验的特点恰恰相反,数据获取成本高,实验周期长。
Silver提出的解决方案是——先在仿真环境中训练AI,再将其策略迁移到实际系统。
在模拟环境中,AI可以持续优化控制策略,等到足够成熟,再用于真实系统。
这种方式降低了试错带来的风险,也提升了算法的可控性。
在论坛的小组讨论中,大卫·西尔弗、克兰默和奥雷斯塔德等人,都强调了跨学科合作的重要性。
AI科学家和物理学家在方法论、问题定义、数据处理等方面都有不同视角,而正是这种差异,产生了新的研究方式。
AI的参与,帮助物理学家从庞杂的数据中,找出那些被忽略的“异常信号”。
高风险实验、数据成本、理论精度这些问题,使得强化学习并不容易在物理科学中的落地。
但Silver提出的“体验式学习”,正在提供一种新视角:不是让AI替代科学,而是让AI参与探索。
正如西尔弗所说:“AI像婴儿一样学习”,通过探索、试错、反馈,走出一条新的发现之路。
在探索未知的路上,AI不是主角,但它,可能是那个意外带路的人。
来源:妇产科医生小永