智元机器人挑战赛:清华&上海AILab夺冠,华南理工紧随其后

B站影视 韩国电影 2025-10-28 13:29 1

摘要:随后现场又报了两个名次:华南理工的Notonlysim一个人把第二名扛了回来,香港大学的Firebot排在第三。这三个名次,都是IROS杭州现场真机赛上,AgiBot World Challenge根据六个真实物理任务的平均成绩算出来的最终排名。公布成绩那一刻

清华大学联合上海AI Lab组的AIR-DREAM队拿了冠军。

随后现场又报了两个名次:华南理工的Notonlysim一个人把第二名扛了回来,香港大学的Firebot排在第三。这三个名次,都是IROS杭州现场真机赛上,AgiBot World Challenge根据六个真实物理任务的平均成绩算出来的最终排名。公布成绩那一刻,场子先是安静了一秒,接着有人先鼓掌,慢慢变成整片掌声。紧接着,冠军团队把他们的技术细节公开了——讲得比较实在,也引起了不少人的兴趣。

AIR-DREAM讲的重点是他们用的X-VLA模型。说白了,就是把视觉、语言和动作绑在一起的一个大模型,再给不同的机械臂平台各自加一套“可训练的软提示”。这套软提示的作用像是给每台机器做了个小适配器,能把平台之间的数据差异减小。通俗点说,训练出来的一套策略不用为每台手臂重头改写,能更平滑地搬到别的手臂上去——这点在评委和同行看来挺关键的。大家最关心的是训练稳定性和样本效率的问题,问得比较细,交流也很直接。

回头说比赛流程。这次线下真机决赛是Manipulation赛道的收官。现场有11支队伍上场,任务都来自生活场景:仓储拣选、家务、折衣服之类。每个任务都有时间限制,并且按步骤来给分——每队每个任务要做10次尝试,最后取平均分合成总成绩。训练和测试场景是按7比3分的,目的就是看模型在见过的环境里能不能进一步优化,同时也检验在没见过的新环境里的泛化能力。大会给的参考基线是UniVLA(RSS 2025),大家多数都是以它为起点去改进。

把每个任务拆开来说,都是看似日常但对机器人很考验的活儿:

- 整理杂货(Pack groceries),90秒内把桌上的三件零食分别抓起来放进购物袋。抓起就记一分,放进袋子再记一分,单件满分2分,三件合计6分。看得不是创意,是识别、抓取轨迹和落点的稳妥度。

- 从传送带打包(Pack items from conveyor),同样90秒。传送带上跑着15件东西,机器人得在物体移动时识别目标并抓走,至少要成功三次放到指定箱子。计分方式和上面一致,满分6分。这个任务像现实物流里的拣货,考的是实时检测和决策反应速度。

- 折短袖(Fold short sleeves),150秒内按顺序从左右两侧抓住衣服边缘做标准折叠。左抓、右抓、折叠、整理每步各记1分,总共4分。这是柔性物体操控的老大难,布料会掉形,视觉和力控都不容易。

- 微波加热(Microwave the food),150秒要完成开门、放食物、关门、按启动这些动作,分步计分,总分6分。关键在于对门把手、铰链等机构动作的分解和力度控制。

- 补货挂放(Restock the hanging area),60秒内从箱里取指定物品并挂到货架上,抓取1分、放置1分,满分2分。这在狭小空间里的动作精度要求挺高。

- 倒水(Pour water),60秒内抓水壶、向杯里倒指定量水、把壶放回,抓取、倒水、控制水量、放回各记1分,总分4分。核心在液体动态感知和持续精细控制。

每项都很细,分值也很明白,这样评分下来比较公平,也方便队伍把资源投到最有用的技术点上去。

赛后分享环节挺接地气。AIR-DREAM把X-VLA讲清楚了,特别是“软提示”怎么和不同实体配合,怎么在训练里保持稳定。台下有人就训练样本、收敛速度、在不同机械臂上迁移效果这些问题连珠炮似的问。华南理工的曾嘉龙是以“单人参赛”的身份登台,他的做法更接地:算力不够时先用快速微调把预训练大模型拉出一个可靠的基线,然后用低成本方法做一些小改动,一点点把成功率和鲁棒性提高。这个套路实用性强,特别适合资源有限的团队——先把稳的部分做好,再去试新的东西。香港大学Firebot的陈天行讲他们的路线也很直接:以预训练模型π0为核心,在RoboTwin 2.0仿真平台上批量生成数据,用并行化强化学习跑起来。他们用了8块A100、十天时间把思路搭起来,最后把东西部署到真机上,这是仿真到现实路径通了的一个例子。

把视角再拉远一点,整个AgiBot World Challenge并不是一次小展。主办方是智元机器人和OpenDriveLab,赛道覆盖Manipulation和World Model两大方向,总奖金池56万美元。World Model赛道更偏向让AI“预见”物理世界,参赛队伍用智元开源的AgiBot World数据集和EVAC基线去开发。World Model的前三名是VIPL-GENUN、HD-Robo和SHIELD-LMD。比赛分线上仿真和线下真机两段,线上赛持续三个月,有431支队伍参加,来自五大洲、23个国家和地区,涵盖高校、研究所和企业。通过层层选拔后,Manipulation赛道挑出11支队伍来IROS现场比真刀真枪。Manipulation赛道的奖金池是6万美元,冠军拿1万美元。

现场不止比比赛,智元在展区也展示了几款产品:精灵系列、灵犀x2、远征A2等。精灵-G2是刚在16号发布后第一次线下亮相,展位上的一个互动演示是“射箭”,观众可以遥控体验,感觉延迟低、控制精度高,很多人排队试。像这种能“看得见”的演示,对把技术普及给普通观众确实有帮助。

技术上的一些细节也讲得挺清楚。大会指定UniVLA作为基线,这让大家有个统一的起点。训练和测试的7:3比例,和每项任务10次取平均的评分规则,都是为了减少偶发成功的影响,让比较更可靠。现场的真机环境会带来各种微小变化:传送带速度会有摆动、布料有褶皱、门把手摩擦系数稍有不同,摄像头角度哪怕调一点点也会影响识别。队伍们这边调参数,那边重启策略,连换个动作顺序都可能影响结果。有人在传送带任务上打了好几轮补丁才把成功率稳住。Notonlysim那位选手尽管是一个人,但每一步都很稳,稳就是他的优势。

观众里混着同行、学生和工程师。技术分享后很多人继续往台下围着问问题,从训练细节聊到硬件接口,气氛挺自在。评审和组织也很高效,评分点明确,工作人员按流程核对分数和录像,确保每次尝试都有记录,这在真机赛里非常重要,能避免争议。

展区里还放了参赛录像回放,能近距离看机器人折衣服或倒水时的动作轨迹。有队伍在控制策略里加入动作分解器,把复杂任务拆成一堆小动作,再结合视觉回馈一步步完成。这种把大问题拆成小问题做的思路,在现场很多任务里都管用。

比赛结束了,台上台下的交流没有停止。很多队把现场录像带回去作为后续研究的素材。对于做研究的人来说,这种线下真机对抗能把现实世界的问题摆在你面前;对工程师而言,则是检验系统在各种边界条件下表现的机会。人群里有讨论,有记录,也有人在展位前继续试手感,机器的动作、代码的节奏、硬件的回声,都还在现场回荡。

来源:儒雅溪流Gxfm6

相关推荐