让机器人训练不再『靠人喂数据』

B站影视 电影资讯 2025-04-18 20:07 1

摘要:采集员头戴VR设备,手持操作装置,在仿真厨房里完成收拾盘子的动作,他的一举一动都被精准记录,经过专业处理后变成多条合成数据。这是光轮智能(北京)科技有限公司(以下简称“光轮智能”)数据采集的场景。2023年诞生于海淀这片创新热土的光轮智能,主要聚焦生成式人工智

采集员头戴VR设备,手持操作装置,在仿真厨房里完成收拾盘子的动作,他的一举一动都被精准记录,经过专业处理后变成多条合成数据。这是光轮智能(北京)科技有限公司(以下简称“光轮智能”)数据采集的场景。2023年诞生于海淀这片创新热土的光轮智能,主要聚焦生成式人工智能和仿真技术,为具身智能、自动驾驶等行业提供3D、物理真实且具备泛化能力的合成数据。这些高质量的合成数据将更好地推动人工智能在物理世界中的应用。

以自动驾驶为例,自动驾驶汽车经过训练可以发现和识别道路上的其它汽车,毕竟这样的训练数据非常多。但万一遇到一辆因事故“躺平”的汽车呢?现实中翻车事故不常见,想拍数千张甚至更多的翻车照片几乎不可能。这时候,合成数据就派上用场了!通过生成式AI结合仿真技术可以高效合成不同场景的、用于训练机器人算法、自动驾驶算法的数据,包括不同的车型、角度、光照、天气,甚至碰撞后的变形效果等。这就是合成数据“见多识广”的魅力。

合成数据破解具身智能“数据荒”

合成数据是一种由生成式AI和仿真融合技术模仿真实世界的数据。以往,科技公司主要依赖真实数据来构建、训练和改进AI模型,但随着真实数据日益稀缺,为满足AI的“胃口”,科技行业正转向使用合成数据。

2025年政府工作报告强调,“深化数据资源开发利用”,并首次提到“具身智能”。光轮智能联合创始人兼总裁杨海波表示,这表明人工智能技术正从“科研驱动”逐步走向“产业驱动”和“场景驱动”。具身智能领域恰恰是合成数据最具应用潜力的垂直场景。

具身智能是指将人工智能融入机器人等物理实体,赋予它们像人一样感知、学习和与环境动态交互的能力。人形机器人、无人驾驶、可穿戴设备等具有交互性的硬件都是具身智能落地的重要载体。

杨海波表示,在数据规模上,相比大语言模型存量数据和自动驾驶的积累,具身智能缺口巨大。另外,具身智能所需的数据也要整合文本指令、多视角视觉、关节运动轨迹及物理交互等多维信号,复杂度远超纯文本或单一视觉模态。

光轮智能从具身智能、自动驾驶等空间智能场景切入,向客户提供3D视觉真实、物理交互真实、“人在环”(专家介入数据生产全链路)的合成数据解决方案,通过生成式人工智能与仿真结合的技术放大人类对物理世界的认知和示范,有效解决真实数据采集困难、预训练数据缺乏、长尾场景(操作参数在正常范围以外的问题或情形)数据匮乏、数据利用率低等突出问题。

在车端,光轮智能已为多个中国自主品牌出海和城市领航辅助驾驶落地提供数据支持,与多家头部主机厂合作加速端到端算法量产落地。去年以来,光轮智能开始服务国内外最顶尖具身智能公司,成为全球技术领先的具身智能合成数据供应商,合成数据市场份额稳居国内第一。

光轮智能被评为北京市通用人工智能产业创新伙伴计划数据伙伴,是唯一一家合成数据厂商。在资本市场也受到广泛关注,已完成多轮融资,目前股东包括北京市人工智能产业投资基金、经纬创投、SEEFund无限基金、奇绩创坛、辰韬资本等多家知名创投机构。合成数据解决方案在国际顶级创业赛事HICOOL2023全球创业大赛中荣获二等奖,2024年与上海人工智能实验室联合推出并开源自动驾驶3DOccupancy合成数据集“LightwheelOcc”,被用于CVPR2024(国际计算机视觉与模式识别会议)自动驾驶挑战赛。

为机器人训练提供“无限场景”

数据、算法和算力是人工智能发展的三大核心要素。杨海波认为,具身智能规模化落地的主要挑战在数据上,需要解决人工采集成本高、数据标准不一致等问题。

怎样收集机器人训练需要的数据?传统的做法是,依赖人工进行数据采集和标注。杨海波介绍说,实体搭建的采集场,受资源所限场景过于单一,与现实世界差距很大,根本无法满足训练数据需求。就像自动驾驶汽车,在封闭的测试场或赛车场训练得再好,也没法真正上路。

“当面对家居、商超、工厂等复杂场景时,实体搭建多样化的场景不仅难度大,花费更是难以承受。”杨海波表示,这时,用生成式AI和仿真技术生成的合成数据就显示出优势。合成数据的价值不止是“还原某一个世界”,更重要的是能灵活创建各种场景,提供多场景广覆盖、数据分布和物理交互足够真实的数据,让机器人、自动驾驶汽车等能够应对各种实际情况。

以仿真技术规模化生成高质量数据

“比如教机器人开冰箱门,光有画面是不够的。”杨海波介绍说,具身智能尤其需要物理交互性,目前虽然视觉重建技术能解决一部分问题,但仍无法完整还原物理属性和交互特性。教机器人开冰箱门,还要为机器人提供触觉、力反馈等多模态数据,体现磁吸力和阻尼效果。这对数据采集和处理提出了更高要求。

光轮智能自研的Real2Sim2Real(真实到仿真再到真实)的技术栈,同时在视觉和物理交互能力实现了突破,极大缩小了仿真与现实差异。

“人工智能的发展和进步,本质上还要来源于人类的示范和认知,大语言模型的发展表面上依赖算法能力,但其突破性进展本质上得益于人类专家示范数据,以及示范数据利用率的提升。自动驾驶领域,特斯拉的端到端FSDV12/13,也用到了‘五星司机’级别的专家数据。”杨海波表示,人工智能所需数据的完整拼图,一部分是代表人类示范的真实数据,另一部分则是人类示范的放大器——合成数据。为此,光轮智能提出“真实数据×合成数据”方案,即二者的乘积,为人工智能提供更广泛、高效的训练数据。

鉴于真实数据采集成本高,加上仿真和人工智能技术快速发展,杨海波预测,未来具身智能领域90%以上的数据将来自合成数据。光轮智能目前正在构建一个全球领先的具身仿真数据工厂,通过仿真技术规模化生成高质量数据。

光轮智能以海淀为中心,进行全球化战略布局和国际化运营,组建了一支具有生成式人工智能、仿真、合成数据研发和落地能力的交叉背景团队,是国际“0到1”经验最多的合成数据团队。

借助海淀开放包容的创新生态以及优越的营商环境和政策支持,光轮智能通过合成数据为人工智能进入物理世界提供基石、加速具身智能发展,做通用人工智能时代的数据“燃料”。

“作为扎根海淀的科技创业者,我始终坚信这片土地蕴藏着改变世界的力量,海淀以其独特的创新生态为光轮智能提供了生长的丰沃土壤。”杨海波说,光轮智能坚持与海淀同频共振,将通用人工智能推广到千行百业。

记者手记

在合成数据里蹚出一条新路

具身智能产业发展,蕴藏着巨大的机遇。然而,也面临着严峻的挑战。具身智能需要大量的数据作支撑,数据从哪里来?完全靠搭建真实场景,积累真实数据,不太现实。就算搭建了一个场景,条件变了,适用性也存疑。而像网络游戏那样,完全在虚拟空间积累数据,又行不通。

光轮智能的“真实数据×合成数据”方案,为人工智能训练提供了一种路径。在仿真场景里,采集员做出各种动作,就能生成多条合成数据。光轮智能2023年成立以来,已经搭建了数百万个仿真场景。利用这样的仿真场景采集数据,已经服务于国内外多家顶尖具身智能公司。

大语言模型发展,有丰富的数据可资利用。自动驾驶技术发展,也积累了大量的数据。具身智能产业发展,对于数据的积累还有很长的路要走。海淀区于2024年4月率先发布全国首个具身智能三年行动方案,今年2月落地全国首个具身智能创新产业园,已集聚具身智能企业297家,具身智能机器人企业167家,人形机器人整机企业22家,开设具身智能及机器人相关专业的院校21所,形成了以“大脑、小脑、本体”为核心的具身智能全产业链条。集聚效应成为产业发展的强大动能和优势。让我们一起见证海淀具身智能产业,用创新开创未来。

记者 倪恒虎

来源:海淀融媒

相关推荐