强化学习新突破:会打羽毛球的机器狗惊现苏黎世实验室

B站影视 港台电影 2025-05-30 16:54 2

摘要:研究人员在名为ANYmal-D的四足机器人上测试了该控制系统,为其配备立体视觉相机和专为挥动羽毛球拍设计的动力臂。“除羽毛球外,该方法为足式机械臂在其他需要精准感知与快速全身响应的动态任务中的部署提供了模板。”研究团队在声明中表示。

苏黎世联邦理工学院团队展示了一款能自主与人类进行羽毛球对抗的AI驱动四足机器人。

通过基于强化学习的控制系统,该机器人能精准追踪羽毛球飞行轨迹、预测落点,并在场地内移动实施拦截与回击。

研究人员在名为ANYmal-D的四足机器人上测试了该控制系统,为其配备立体视觉相机和专为挥动羽毛球拍设计的动力臂。“除羽毛球外,该方法为足式机械臂在其他需要精准感知与快速全身响应的动态任务中的部署提供了模板。”研究团队在声明中表示。

羽毛球运动要求运动员协调迅捷步法与精准手臂动作,对感知与运动控制构成双重挑战。

由于现有控制器与硬件限制,在足式机器人中复现该能力一直存在困难。人眼在运动稳定与焦点追踪方面远超商用机器人相机,使得高速移动物体(如羽毛球)的视觉追踪尤为复杂。

虽然先前运动机器人研究在翻滚、奔跑等动态任务中通过强化学习(RL)取得进展,但这些成果往往缺乏操作整合或依赖静态环境。

本研究开发了基于统一强化学习控制器的四足机器人系统,使其能通过机载感知自主完成羽毛球运动。该系统整合足式运动与球拍挥动,实现实时追踪、预测与回球。在仿真中训练的运动感知模型可补偿运动引起的视觉误差,缩小仿真与现实差距。

控制器采用非对称行动者-评论家框架,通过追踪每回合多个挥拍目标学习连续响应行为。该方法平衡敏捷性与视觉精度,结合羽毛球轨迹预测、约束强化学习和动态系统辨识,确保真实对抗中的可靠性。

“我们方法的关键优势在于控制器采用端到端训练——上肢与下肢从初始阶段就同步优化。协调手臂与腿部运动,协调左腿与右腿运动之间不存在架构差异。因此,肢体在训练中自然学会动态补偿,形成协调的全身运动。”论文共同作者、苏黎世联邦理工学院机器人实验室研究员马运涛(音译)向《Interesting Engineering》解释。

团队测试显示,该机器人能根据人类击球的不同速度与角度在场内移动回击,实现连续10次击球的回合对抗。

集成强化学习方法将全身运动与视觉感知结合,机器人根据时机与距离调整步态,成功拦截最高12.06米/秒的羽毛球。机器人还能以后腿站立保持视野,在挥拍前优先确保平衡与防摔安全。

尽管在友好对抗中表现良好,但面对扣杀等快速攻击时成功率较低。团队指出这源于相机感知与执行器速度的硬件限制,而非控制算法本身存在缺陷。

关于控制框架是否适配其他运动,马运涛表示:“框架具有通用性,我们已将其扩展至精准投掷任务。更广泛地说,最具迁移价值的是将主动感知整合进强化学习训练的方法论,这对需要感知-控制紧密协同的任务具有普适性。”

未来需提升感知响应速度以延长对抗回合并实现全场竞技。当前系统从对手击球到机器人首次挥拍指令存在平均0.375秒延迟。“通过高速相机或多模态传感降低延迟,将显著提升拦截高速远距离球的能力。”马运涛补充道。

来源:靖瑶教育

相关推荐