摘要:英伟达近期集中开源多项机器人领域核心技术,其中包括与迪士尼研究中心(Disney Research)、谷歌 DeepMind 联合研发的物理引擎 Newton,该引擎已正式纳入开源生态。
英伟达近期集中开源多项机器人领域核心技术,其中包括与迪士尼研究中心(Disney Research)、谷歌 DeepMind 联合研发的物理引擎 Newton,该引擎已正式纳入开源生态。
作为此次开源动作的重点,Newton 物理引擎基于 NVIDIA Warp 框架构建,借助 GPU 并行计算实现高精度仿真,可支持机器人与布料、食品等可变形物体的复杂交互,还能兼容 Isaac Lab、MuJoCo Playground 等主流机器人学习框架,为开发者解决 "仿真与现实脱节" 的核心痛点。而除了这一跨机构合作的引擎外,英伟达同步开源的还包括 Isaac GR00T 机器人推理模型、Cosmos 视觉标记器等技术,覆盖从仿真训练到环境感知的全研发链路。
Newton 物理引擎:给仿真环境注入 “真实” 灵魂
全球 25 万余名机器人开发者正共同面对一个棘手问题:怎样让机器人在仿真环境中习得的技能,能安全可靠地应用到现实场景中?人形机器人关节结构复杂,平衡控制难度极大,现有物理引擎已难以满足需求。
英伟达 Omniverse 与仿真技术副总裁 Rev Lebaredian 曾表示:“人形机器人是物理 AI 的下一个前沿,它们需要在不可预测的世界中推理、适应环境并安全行动。” 而 Newton 引擎的出现,恰好精准解决了这一痛点。
作为由 Linux Foundation 管理的开源项目,Newton 基于英伟达 Warp 和 OpenUSD 框架打造,借助 GPU 加速技术,能精准仿真机器人的复杂动作 —— 无论是在雪地、碎石路行走,还是操控杯子、水果等精细操作,都能逼真呈现。
目前,苏黎世联邦理工学院机器人系统实验室、慕尼黑工业大学、北京大学等顶尖高校已率先启用 Newton,光轮智能与仿真引擎公司 Style3D 也加入了早期用户阵营。
Isaac GR00T N1.6:给机器人装上 “深度思考大脑”!
让机器人理解“帮我拿杯水”这样的模糊指令,一直是业界的难题。
英伟达最新发布的Isaac GR00T N1.6开源模型,通过集成Cosmos Reason视觉语言模型,让机器人拥有了接近人类的推理能力,即将在Hugging Face平台上线。
它依托既有知识、常识和物理规律,能把模糊指令转化为一步步的执行方案。值得关注的是,机器人可同步完成移动与物体操控动作,躯干和手臂活动范围更大,甚至能推开较重的房门。
目前,Cosmos Reason 下载量已超 100 万次,在 Hugging Face 物理推理模型排行榜上始终位居第一。英伟达还提供了开源物理 AI 数据集,包含数千条合成及真实世界轨迹数据,下载量已突破 480 万次。AeiROBOT、Franka Robotics、LG Electronics 等头部机器人制造商,正评估采用 Isaac GR00T N 系列模型。
训练革新:从抓取技能到全面测试
教会机器人抓取物体,是机器人领域的一大难题。基于英伟达 Omniverse 打造的 Isaac Lab 2.3 开发者预览版,新增了灵巧抓取工作流。其巧妙之处在于采用 “自动化课程体系”:从简单任务起步,逐步增加难度,同时调整重力、摩擦力、物体重量等参数,让机器人即便在不可预测的环境中,也能掌握抓取技能。波士顿动力的 Atlas 机器人正是通过这个工作流学习抓取,操控能力有了明显提升。
为解决测试场景零散、简单化的问题,英伟达联合光轮智能开发了 Isaac Lab Arena—— 这是一个用于大规模实验和标准化测试的开源策略评估框架。有了它,开发者无需从零搭建系统,就能在仿真环境中开展复杂且大规模的评估。
全新 AI 基础设施加持,机器人开发按下 “加速键”
在硬件布局上,英伟达同样投入颇深。GB200 NVL72 机架式系统集成了 36 颗 Grace CPU 与 72 颗 Blackwell GPU,目前已被多家云服务提供商采用。RTX PRO 服务器则为机器人开发的各类工作负载提供统一架构,RAI Institute 已抢先应用。
最受关注的当属搭载 Blackwell GPU 的 Jetson Thor,它能支持机器人运行多个 AI 工作流,实现实时智能交互。Figure AI、银河通用、Google DeepMind、宇树科技等合作伙伴已着手采用这款产品。
在 CoRL 收录的论文中,近半数引用了英伟达相关技术。卡内基梅隆大学、华盛顿大学等顶尖研究机构,均在使用英伟达的 GPU、仿真框架及 CUDA 加速库。斯坦福视觉与学习实验室的 BEHAVIOR 机器人学习基准测试项目,以及北京大学开发的触觉机器人仿真平台 Taccel,均基于英伟达技术构建。
从开源物理引擎到基础模型,从训练工作流到硬件基础设施,英伟达此次的 “全栈式” 布局,正重新定义机器人研发的游戏规则。机器人从实验室走向日常生活的进程,或许比我们预想的要快得多。
来源:世界先进制造技术论坛