摘要:2025 年 3 月 18 日,NVIDIA 宣布推出一系列全新技术,助力人形机器人开发。其中包括全球首个开源且完全可定制的基础模型 NVIDIA Isaac GR00T N1,该模型可赋能通用人形机器人实现推理及各项技能。
· 推出完全可定制的 GR00T N1 基础模型,为人形机器人赋予通用技能与推理技能
· NVIDIA、Google DeepMind 和 Disney Research 合作开发新一代开源物理引擎 Newton
· 用于合成数据生成的全新 Omniverse Blueprint 和开源数据集快速开启物理 AI 的数据飞轮
2025 年 3 月 18 日,NVIDIA 宣布推出一系列全新技术,助力人形机器人开发。其中包括全球首个开源且完全可定制的基础模型 NVIDIA Isaac GR00T N1,该模型可赋能通用人形机器人实现推理及各项技能。
其他技术包括仿真框架和蓝图,如用于生成合成数据的 NVIDIA Isaac GR00T Blueprint,以及和 Google DeepMind 及 Disney Research 共同开发的、专为机器人开发而构建的开源物理引擎 Newton。
已推出的 GR00T N1 是 NVIDIA 一系列可完全定制模型中的首个模型。NVIDIA 将对这一系列模型进行预训练,并面向全球机器人开发者发布。对于受全球劳动力短缺困扰的行业而言(劳动力缺口预计超过 5,000 万),这一模型的推出将有助于加速这些行业的转型。
“通用机器人的时代已经到来,”NVIDIA 创始人兼 CEO 黄仁勋表示。 “借助 NVIDIA Isaac GR00T N1 以及新的数据生成和机器人学习框架,全球机器人开发者将开启 AI 时代的全新篇章。”
受人类认知原理的启发,GR00T N1 基础模型采用双系统架构。“系统 1”是一个快速思考的动作模型,反映人类的本能反应或直觉。“系统 2”是慢思考模型,用于进行经过深度思考的决策制定。
系统 2 由视觉语言模型提供支持,它会对所处环境和接收到的指令进行推理,从而规划行动。系统 1 随后将这些规划转化为精确、连续的机器人运动。系统 1 基于人类演示数据和 NVIDIA Omniverse™ 平台生成的海量合成数据进行训练。
GR00T N1 可轻松适应并完成通用任务,如单手或双手抓取、移动物体,将物体从一只手臂转移到另一只手臂,或执行需要长语境和通用技能组合的多步骤任务。这些功能可应用于物品搬运、包装和检查等各种使用场景中。
开发者和研究人员可以使用真实数据或合成数据针对特定人形机器人或任务对 GR00T N1进行后训练。
在 GTC 主题演讲中,黄仁勋展示了 1X 的人形机器人自主执行室内清理任务的过程,该过程利用了基于 GR00T N1 的后训练策略。该款机器人的自主能力是 1X 与 NVIDIA AI 训练协作的成果。
“人形机器人的未来开发重点在于适应能力和学习能力,”1X Technologies 首席执行官 Bernt Børnich 表示。 “NVIDIA 的 GR00T N1 模型在机器人推理和技能方面实现了重大突破。 我们仅需最少量的后训练数据,就能在 NEO Gamma 上全面部署,这进一步推进了我们的使命——我们创造的机器人不是工具,而是伙伴,可以为人类提供有意义、有无限价值的帮助。”
全球其他优先使用 GR00T N1 的领先机器人公司包括 Agility Robotics、波士顿动力、Mentee Robotics 和 NEURA Robotics。
NVIDIA 宣布与 Google DeepMind 和 Disney Research 合作,共同开发开源物理引擎 Newton,可让机器人学习如何以更高的精度处理复杂任务。
Newton 基于 NVIDIA Warp 框架构建,将针对机器人学习进行优化,并与 Google DeepMind MuJoCo 和 NVIDIA Isaac™ Lab 等仿真框架兼容。此外,三家公司还计划让 Newton 能够利用迪士尼的物理引擎。
Google DeepMind 正在和 NVIDIA 合作开发 MuJoCo-Warp,预计将机器人机器学习工作负载处理速度提升至 70 倍以上,并将通过 Google DeepMind 的 MJX 开源库和 Newton 提供给开发者。
Disney Research 将成为首批使用 Newton 以推动其机器人角色平台发展的公司之一,该平台为下一代娱乐机器人提供支持,比如此次 GTC 主题演讲中和黄仁勋一起登台、以星球大战® 为灵感设计的富有表现力的 BDX 机器人,就是该平台的成果。
“BDX 机器人只是一个开始。我们致力于以前所未有的方式,为更多角色赋予生命,而与 Disney Research、NVIDIA 和 Google DeepMind 的合作是实现这一愿景的关键,”Walt Disney 想象工程研发部门高级副总裁 Kyle Laughlin 说。 “此次合作将使我们能够创造出比以往更具表现力、更具吸引力的新一代机器人角色,并以迪士尼独有的方式与我们的游客建立联系。”
NVIDIA 还将和 Disney Research 及 Intrinsic 进一步合作,为机器人数据流构建 OpenUSD 管线和最佳实践。
大型、多样化且高质量的数据集对机器人开发至关重要,但捕获成本高昂。真实世界中,每人一天只有 24 小时,由此产生的人类演示数据,对于人形机器人来说是远远不够的。
今天宣布的用于合成运动生成的 NVIDIA Isaac GR00T Blueprint 有助于应对这一挑战。 该蓝图基于 Omniverse 和 NVIDIA Cosmos Transfer 世界基础模型构建,让开发者可以通过少量的人工演示生成大量合成运动数据,以用于操作任务。
利用为蓝图提供的首批组件,NVIDIA 能够在短短 11 小时内生成 780,000 个合成轨迹,相当于 6,500 小时或连续九个月的人类演示数据。然后,通过将合成数据与真实数据相结合,与仅使用真实数据相比,NVIDIA 将 GR00T N1 的性能提高了 40%。
GTC 上还宣布,为了进一步为开发者社区提供有价值的训练数据,NVIDIA 将发布 GR00T N1 数据集,作为更大的开源物理 AI 数据集的一部分,现在可通过 Hugging Face 下载。
可用性NVIDIA GR00T N1 训练数据和任务评估场景现在可以通过 Hugging Face 和 GitHub 下载。用于合成运动生成的 NVIDIA Isaac GR00T Blueprint 现在也以交互式演示形式在 build.nvidia.com 展示,也可以通过 GitHub 下载。
今日,GTC 还宣布推出了 NVIDIA DGX Spark,一款个人 AI 超级计算机,为开发者提供一站式系统,可将 GR00T N1 的功能扩展到新机器人、任务和环境,而无需进行大量自定义编程。
Newton 物理引擎预计将在今年晚些时候推出。
来源:小象科技论