控制科学 x 机器学习前沿:PID控制器加速人工智能优化训练|Nat. Commun.速递

B站影视 2024-12-07 19:18 2

摘要:近日,Nature Communications 发表题为“Accelerated optimization in deep learning with a proportional-integral derivative controller”的最新论文,该

导语

近日,Nature Communications 发表题为“Accelerated optimization in deep learning with a proportional-integral derivative controller”的最新论文,该研究将闭环反馈控制与优化算法建立联系,创新性地提出面向深度学习的受控加速优化算法 PIDAO(注:PIDAO 读作“辟道”)。本研究不仅有助于加速深度学习模型的训练,提出的虚拟物理学与控制理论等学科交叉方法也为深度学习研究另辟蹊径。

关键词:深度学习,控制理论,动力系统,虚拟物理学,Control for Learning

论文题目:Accelerated optimization in deep learning with a proportional-integral derivative controlle 论文地址:https://www.nature.com/articles/s41467-024-54451-3 论文作者:陈嵩、刘佳旭、王鹏凯、许超、蔡声泽、褚健

人工智能已在众多领域展现了卓越的应用潜力,但AI模型的训练往往需要耗费大量时间和计算资源,背后也蕴含着复杂的优化理论和动力学问题。模型的训练(即目标函数的优化)问题通常面临两个主要挑战:一是高维非凸优化问题带来的复杂损失景观;二是大规模数据和深层网络的计算代价。在本项工作中,研究团队融合数值优化、动力系统、控制理论、数值计算等多个方向,为理解深度学习的训练机制带来新的研究视角。

当前,多数深度学习模型的训练最终可归结为高维优化问题求解,而基于梯度的方法是求解优化问题的关键,如SGD、Adam、重球法等常用方法。如何理解这些优化算法的本质及其动态过程,是突破深度学习可解释性的一大挑战。团队通过引入虚拟物理学来建模优化过程(如当前工作运用了经典力学二阶ODE建模),随后把优化问题转化成高维参数空间中的动力学控制问题,如此一来,丰富的反馈控制理论体系可以为优化算法设计与收敛性分析提供全新的思路。

重球法(Heavy-ball optimizer)的动力系统观点,利用Lyapunov稳定性分析算法收敛性

针对如何加速训练神经网络这一问题,该工作将控制科学中使用最为广泛的比例-积分-微分(PID)反馈控制律应用于刻画优化过程的虚拟物理动力学,创新地提出用于深度学习的连续时间PID加速优化器(Proportional-Integral-Derivative Accelerated Optimization, PIDAO)。通过构建合适的Lyapunov函数来建立PIDAO中超参数与稳定性之间的关系,以及动力系统平衡点与高维参数空间训练问题最优性的关联。

相比于Polyak提出的重球法,PIDAO不再单一受梯度调控其优化方向,而是通过PID反馈给寻优机器人以函数梯度(当前“地势”)、一段历史梯度积分(过往“地势”)以及前方梯度趋势(未来“地势”)三类信息,来控制导航寻优过程。简单来说,Polyak方法用到了“现在”,Nesterov方法用到了“现在”和“未来”,而PIDAO融合三类信息共同决策寻优。

用于深度学习的PID加速优化算法的基本思想

此外,基于Lyapunov稳定性理论,研究团队提供了PIDAO在凸优化问题和非凸优化问题的超参数选取范围,同时发现PIDAO优化器的抵消效应,该特性使得PIDAO具有更强的探索损失景观的能力。此外,借助 PID 控制器和 PIDAO 之间的联系,研究团队提供了PIDAO优化器的超参数可解释性。利用不同离散化方法对PIDAO离散化,进而发展出用于神经网络训练的PIDAO优化器并集成于深度学习框架(如Pytorch)。与基准优化算法方法(如Adam)相比,PIDAO系列算法在不同的测试场景中均获得更高的训练精度和更快的收敛速度。

该项研究所提出的受控重球优化器框架和加速优化算法PIDAO,有助于加速深度学习模型训练,同时也为基于控制理论方法研究深度学习问题提供了新思路。

近年来,浙江大学控制科学与工程学院研究团队重点关注控制科学与机器学习的交叉研究,特别是Control for Learning(控制赋能学习),这属于 Science for AI 范畴,近期相关的工作包括:分布式优化求解(Liu et al., IET CSR, 2023)、基于鲁棒控制的神经网络设计(Chen et al., IEEE TNNLS)、基于反馈的神经网络模型设计(Wang et al., Neurocomputing, 2024)等。此外,团队在 AI for Science 方面发表了大规模粒子智能可视计算(Liang et al., Nature Machine Intelligence)等工作。

经典算法与PIDAO算法,在凸优化与非凸优化问题的对比

PIDAO与Adam等经典算法在神经网络,求解偏微分方程问题上的性能对比

AI+Science 读书会

AI+Science 是近年兴起的将人工智能和科学相结合的一种趋势。 一方面是 AI for Science,机器学习和其他 AI 技术可以用来解决科学研究中的问题,从预测天气和蛋白质结构,到模拟星系碰撞、设计优化核聚变反应堆,甚至像科学家一样进行科学发现,被称为科学发现的“第五范式”。 另一方面是 Science for AI,科学尤其是物理学中的规律和思想启发机器学习理论,为人工智能的发展提供全新的视角和方法。

集智俱乐部联合斯坦福大学计算机科学系博士后研究员吴泰霖(Jure Leskovec 教授指导)、哈佛量子计划研究员扈鸿业、麻省理工学院物理系博士生刘子鸣(Max Tegmark 教授指导),共同发起以”为主题的读书会,探讨该领域的重要问题,共学共研相关文献。 读书会已完结,现在报名可加入社群并解锁回放视频权限。

详情请见:

控制科学前沿理论与方法系列课程

对复杂动态系统的定量认识与科学调控,系统学与控制论是关键基础。控制理论是一门高度综合、充满活力的交叉学科,处于数学、计算机科学和工程技术科学相互作用的前沿,是信息科学与系统科学的重要组成部分,同时与自然科学和管理科学的各门分支也有密切的联系。在工程、国防军事、社会、经济、生物、环境等领域复杂系统中的调控问题,发挥着重要作用。《控制科学前沿理论与方法》系列课程,为面向控制专业领域学生以及跨领域的学习者做深度科普,帮助学习控制论的核心思想、框架与方法。详情请见:

1.

2.

3.

4.

5.

6.

来源:小周科技论

相关推荐