全球首个零售VLA大模型来了!还开源OpenWBT让机器人遥操门槛暴降

B站影视 内地电影 2025-06-09 14:10 2

摘要:6月6日-7日,2025 北京智源大会召开。作为全球具身智能领域最具影响力的学术与产业双栖盛会,本次大会汇聚了顶尖科研机构、技术领军企业和开源社群。

允中 发自 凹非寺

6月6日-7日,2025 北京智源大会召开。作为全球具身智能领域最具影响力的学术与产业双栖盛会,本次大会汇聚了顶尖科研机构、技术领军企业和开源社群。

北京大学助理教授、银河通用机器人创始人及CTO、智源学者王鹤博士受邀出席开幕式圆桌论坛。

银河通用具身大模型机器人Galbot一同登上主论坛舞台,面向全球观众直播展示最新技术成果。这是Galbot的全球直播首秀,全程无遥操,无需场景数据预采集。

此次主论坛直播,零距离展现了银河通用具身大模型驱动机器人产业落地的硬实力。

以下是此次发布的核心成果:

开幕式现场,银河通用机器人Galbot G1登上主论坛舞台,面向全球观众直播展示最新技术成果,零距离展现了银河通用具身大模型驱动机器人产业落地的硬实力。

机器人在王鹤博士的语音指令下自主、精确的移动到准确位置并将饮料从货架取出,全程无遥操、自主推理、并且无事先采集场景数据

此次Galbot G1展示的货架精准取货,背后的技术正是银河通用团队最新研发的端到端具身大模型GroceryVLA

可在现场搭建的1:1还原的真实商超场景中,实现复杂货架抓取与交付的全流程自主执行。

它所展现的,并非一次临时编排的演示流程,而是一次面向真实商业场景的能力展示:

从感知到动作、从语言指令到精准操作,全部依靠模型自主完成。其稳定、高效的表现,迅速引发现场学术专家、行业人士与媒体的围观与热议。

也正因其在真实复杂环境中的卓越表现,这台Galbot作为代表获智源大会主办方直接邀请,成为本届大会唯一登上主论坛主舞台,面向产业应用的具身大模型系统,在全场瞩目下完成全球直播发布。

在智源大会主展区,银河通用展示了两台“性格”迥异的具身大模型Galbot“迎宾机器人”和“售货机器人”,凭借鲜明互动风格与真实应用能力,吸引了大量观众驻足围观,成为全场最受关注的技术展区之一。

据王鹤博士介绍,银河通用机器人正通过与零售业态合作伙伴广泛合作,年内计划开设100家店

作为全球首个面向零售行业的端到端具身VLA大模型,GroceryVLA标志着银河通用在具身智能领域的重大技术突破。

以下是GroceryVLA五大核心能力的详解,揭示其为何能够稳定适配商超复杂环境、实现高度通用的自主操作。

GroceryVLA采用端到端模型架构,突破传统“视觉+轨迹规划”方案,在紧密排布、涵盖数十种SKU的真实货架环境中,自主识别并完成商品抓取。

无需路径规划,即可在几乎无空隙的货架上稳定作业,展现出卓越的操作效率与灵活性,标志着端到端大模型驱动的闭环控制已具备商用能力。

模型无需针对每种商品包装单独调参,支持软包装(如袋装面包、卤蛋)、硬盒、塑料瓶、透明果冻杯等多样形态商品的精准抓取,实现了跨品类的统一抓取策略。

无论是刚性包装还是柔性物体,都能精准取放,满足全品类零售场景需求。

基于大规模仿真数据和多场景训练,模型可直接泛化至全新环境。

此次展会为其首次异地实战部署,面对光照变化、货物随机摆放等复杂条件依然表现稳定

主论坛全球直播首秀更实现全程无遥控、无场地预采,全面展现其卓越的零样本泛化能力。

面对货架上多个相似商品,GroceryVLA能够基于任务需求动态判断最优抓取目标,区别于传统静态“指定抓”策略。

系统按照指定顺序精准执行,展现出高级任务理解与灵活调度能力,确保多样化操作流程有条不紊。

在抓取过程中,模型具备实时闭环策略调整能力,能够快速响应现场人为干扰,如货物被移走、增加或推挤,甚至抓取动作中瓶子被碰倒后重新扶正,保障任务连续高效完成,展现出真正具备商业落地价值的鲁棒性和实用性。

无论是面对主论坛舞台高强度灯光和复杂场地条件干扰,还是在展区人流密集穿梭环境中,GroceryVLA所驱动的Galbot始终稳定完成了从视觉感知、目标识别到自主抓取交付的全流程闭环操作,全面展现出模型的工程稳定性与实际可用性。

这一表现,不仅是银河通用技术自信的体现,更意味着其具身智能产品已具备真正面向商业落地的能力。

除了推动Galbot在更广泛的零售场景的稳定商业落地外,银河通用也在持续关注人形机器人的技术进展

在人形机器人领域,稳定易用且支持全身动作的遥操作系统长期缺失,成为制约数据采集、高质量大模型训练及商业应用落地的关键瓶颈。

传统系统部署繁琐、兼容性差,且多局限于上半身动作,难以覆盖真实工作场景所需的完整人类工作空间。

基于此,银河通用联合清华大学弋力助理教授团队正式发布OpenWBT ——全球首款全开源、多机型、跨虚实人形机器人全身遥操作系统。

OpenWBT创新实现了小时级快速部署,用户仅凭一副VR眼镜与一台普通电脑,便可从零完成系统搭建与调试,迅速解锁人类级操作自由度。

系统设计注重易用性,初学者仅需一副VR眼镜和一台普通电脑,最多仅需数小时内即可完成系统搭建与调试,显著降低部署门槛,同时可以轻松适配室内外各种环境。

现已支持Unitree G1、H1两多款机器人,涵盖不同自由度与身高规格,实现对完整人类工作空间的高效覆盖,满足多样化机器人硬件需求。

不仅支持对真实物理机器人的实时遥控,还兼容虚拟仿真环境遥操作,方便大规模数据采集和基于仿真数据的泛化训练,促进模型高效迭代。

在动作控制方面,OpenWBT将机器人运动拆分为“走路、蹲下、弯腰、触达”等基础“原子技能”,每项技能均在真实环境中经过稳定训练与验证。

通过先进的技能融合算法,系统能够自动组合原子动作,形成连贯复杂的任务序列,实现机器人“碰天触地”的全身动作协调能力。

OpenWBT的全面开源发布,是银河通用致力于构建开放共享具身智能生态的重要成果。

为全球首个标准化、模块化的人形机器人全身遥操作框架,OpenWBT极大降低了行业技术门槛,为科研机构和产业界提供了稳定高效的训练与测试平台。

该项目推动了开放共享的社区生态建设,促进更多研究机构和企业的协同参与,加速具身智能技术的积累与迭代,助力人形机器人从实验室走向实际应用,实现产业创新与共赢发展。

展望未来,银河通用将继续秉持技术创新与开放合作并重的发展理念,引领人形机器人从“实验室探索”迈向“广泛应用”,实现机器人真正“工作起来”,深化具身大模型技术与产业协作的融合应用,推动更多行业场景智能化升级,助力构建更加智能、高效、可持续的未来社会。

同时,银河通用期待与更多合作伙伴携手共进,共同谱写具身智能新时代的辉煌篇章。

— 完 —

来源:湖北台科技快报

相关推荐