摘要:当你走在市中心时,听到街对面建筑工地传来一声巨响——你可能会有僵住甚至蹲下的冲动。这种快速的本能反应是我们保护自己并在陌生环境中生存的最基本但最重要的进化过程之一。
当你走在市中心时,听到街对面建筑工地传来一声巨响——你可能会有僵住甚至蹲下的冲动。这种快速的本能反应是我们保护自己并在陌生环境中生存的最基本但最重要的进化过程之一。
如今,研究人员开始探索如何将人脑这样类似的快速反应思维过程应用于机器人。他们的想法是,对机器人进行编程,使其能够像人类一样做出决策,这种决策基于我们对未知刺激的先天情绪反应——尤其是恐惧反应。相关研究结果于近日发表在《IEEE机器人与自动化快报》上,表明这种方法可以显著提升机器人评估风险和规避危险情况的能力。
意大利都灵理工大学自动化工程与机器人技术副教授亚历山德罗·里佐(Alessandro Rizzo)领导了这项研究。他指出,机器人目前在适应动态环境和制定自我保护策略方面面临诸多挑战。这在很大程度上是因为它们的控制系统通常被设计用于完成非常具体的任务。“因此,机器人可能难以在复杂多变的环境中有效运行,”里佐说道。
1
INTRODUCTION
人类大脑如何应对风险
另一方面,人类能够对遇到的各种不同且独特的刺激做出反应。理论上,我们的大脑有两种不同的方式计算、评估和应对这些场景中的风险。
第一种涉及一种非常先天的反应,即我们感知到外部刺激(例如,建筑工地传来的巨响),大脑会做出非常快速、情绪化的决定(例如僵住或躲避)。在某种程度上,我们的大脑会快速响应这些场景中的原始数据,而不是花时间进行更彻底的处理。
根据一种名为“双通路假说”的大脑运作理论,这种反应是由“低路”神经回路引发的,低路神经回路负责控制情绪,由杏仁核驱动。但当我们的大脑运用经验和更清晰的推理(涉及前额叶皮层)时,这便是第二条“高路”神经回路来对刺激做出反应。
Rizzo 和他实验室的博士生Andrea Usai好奇地想看看这两种应对危险情况的不同方法在需要导航到陌生环境的机器人身上会如何发挥作用。他们首先设计了一个机器人控制系统,通过低矮的道路模拟恐惧反应。
“我们专注于恐惧,因为它是神经科学领域研究最多的情绪之一,而且在我们看来,它也是最有潜力应用于机器人领域的情绪,”Usai说道。“恐惧与自我保护和对危险的快速反应密切相关,这两者对于适应性行为都至关重要。”
2
METHOD
机器人强化学习
为了模拟机器人的恐惧反应,研究人员设计了一个基于强化学习的控制器,帮助机器人根据周围环境的原始数据实时动态地调整其优先级和约束。这些结果为第二种称为非线性模型预测控制器的算法的行为提供了参考,该算法为机器人的运动设置了相应的运动模式。
通过模拟,Rizzo 和 Usai 测试了他们的机器人如何在陌生环境中导航,并将其与其他没有恐惧元素的机器人控制系统进行了比较。模拟涉及不同的场景,包含各种危险和非危险障碍物,这些障碍物在模拟环境中静止或移动。
结果表明,与传统机器人设计相比,采用低路编程的机器人能够以更平稳、更安全的路径导航至目标。例如,在一个危险物动态移动的场景中,低路机器人能够以约 3.1 米的距离绕过危险物体,而本研究中测试的另外两个传统机器人与危险物体的距离则分别只有令人恐惧的 0.3 米和 0.8 米。
Usai 表示,这种低调的机器人方法在许多不同的场景中都很有用,包括物体操纵、监视和救援行动,这些情况下机器人必须应对危险情况,并且可能需要采取更谨慎的行为。
3
SIGNIFICANCE
类脑模型架构的未来应用
这一研究不仅让机器人学会了“恐惧”这种原始情绪,更重要的是,它为人工智能和自主系统提供了一条仿效人脑进化路径的范式——先用低路机制实现即时避险,再结合高路策略进行理性规划。但正如 Usai 所指出的,低路策略本质上非常被动,更适合短期内需要的快速决策。因此,研究团队正在研究一种模拟高路策略的控制设计,在补充低路策略的同时,可以帮助机器人做出更理性、更长期的决策。
研究人员正在考虑使用多模态大型语言模型(例如ChatGPT)来实现这一目标。正如 Rizzo 所解释的那样:“这些模型可以帮助模拟人类前额叶皮层的一些核心功能,例如决策、战略规划和情境评估,从而使我们能够在机器人中模拟更多认知驱动的反应。”
“展望未来,尝试扩展架构以融入多种情感也将很有趣,”里佐补充道,“从而使机器人系统能够实现更丰富、更细致的自适应行为。”
新闻来源:IEEE SPECTRUM
论文参考:DOI: 10.1109/LRA.2025.3583630
来源:启真脑机智能基地