人形机器人发展按下“加速键”——NVIDIA开源核心工具集

B站影视 内地电影 2025-09-30 09:57 1

摘要:Newton开创机器人物理仿真新标准机器人在仿真环境中的学习速度更快、安全性更高,但人形机器人关节结构、平衡控制和动作模式非常复杂,现有物理引擎的性能已经难以满足。全球超过 25 万机器人开发者亟需精准的物理仿真技术,以确保在仿真环境中教会机器人技能,同时安全

仿真训练是机器人学习的基石,也是机器人能够更快投入现实应用中的重要驱动力,但“虚拟”与“现实”之间的鸿沟一直是核心难题。现有引擎往往难以精确模拟复杂的物理交互,往往导致在仿真中表现优异的机器人在现实中“步履维艰”。NVIDIA 最新发布的开源模型与仿真库,有望进一步加速机器人的研发进程。 日前,NVIDIA 在机器人学习大会(CoRL)上宣布,开源物理引擎 Newton 已可通过 NVIDIA Isaac Lab 获取,同时推出的还有用于机器人技能的开源推理视觉语言动作模型 NVIDIA Isaac GR00T N1.6,以及全新 AI 基础设施。 这些技术为开发者和研究人员提供了开源的机器人加速平台,能够加快迭代周期、统一测试标准、整合训练与机器人端推理,并助力机器人安全可靠地将技能从仿真环境迁移到现实世界。

Newton开创机器人物理仿真新标准机器人在仿真环境中的学习速度更快、安全性更高,但人形机器人关节结构、平衡控制和动作模式非常复杂,现有物理引擎的性能已经难以满足。全球超过 25 万机器人开发者亟需精准的物理仿真技术,以确保在仿真环境中教会机器人技能,同时安全可靠地迁移到现实世界。 根据NVIDIA的最新发布,由Linux Foundation管理、GPU加速的开源物理引擎Newton已发布测试版本。该物理引擎由 Google DeepMind、Disney Research 与 NVIDIA 联合开发,基于NVIDIA Warp和OpenUSD框架构建,现已开放使用。 凭借Newton灵活的设计,以及兼容多种物理求解器的能力,开发者现在可以对非常复杂的机器人动作进行仿真,例如在雪地或碎石路面行走、操控杯子和水果等,并且能够成功地将这些动作部署到现实场景中。 包括苏黎世联邦理工学院机器人系统实验室、慕尼黑工业大学及北京大学在内的众多知名高校,以及机器人技术公司光轮智能,仿真引擎公司Style3D已经率先使用 Newton。 如何看待Newton开源的产业意义?这应该意味着全球开发者可以共同参与,注入更多真实世界的物理参数。如果Newton能够成功弥合“模拟与现实”的差距,将极大降低机器人试错成本,加速技术迭代。 正如NVIDIA Omniverse 与仿真技术副总裁 Rev Lebaredian所说:“通过最新升级,开发者可以拥有将机器人从研发阶段带入日常生活的三大核心工具,包括充当机器人‘大脑’的 Isaac GR00T,负责对机器人‘身体’运作进行仿真的物理引擎 Newton,以及作为机器人‘训练基地’的 NVIDIA Omniverse。”Cosmos Reason为全新开源模型Isaac GR00T N1.6提升机器人推理能力为了在物理世界中执行类似人类的任务,人形机器人必须能够理解模糊指令,并应对各种以前未见过的复杂情况。 最新发布的开源机器人基础模型NVIDIA Isaac GR00T N1.6,即将在Hugging Face平台上线。这一模型将集成NVIDIA Cosmos Reason——一款专为物理AI打造的开源、可定制的推理视觉语言模型。作为机器人的“深度思考大脑”,Cosmos Reason 能够利用已有知识、常识和物理原理,将模糊的指令转化为逐步执行的计划,从而应对新场景并泛化到多种任务中去。 举个例子,类似“把房间收拾一下”的模糊指令,往往由于缺乏具体的执行要求,使得机器人难以理解,因此,让它理解人类意图并自主规划就成为一个重要的突破方向。 Cosmos Reason扮演的正是“深度思考大脑”的角色,能够帮助机器人将模糊指令分解为可执行的步骤计划,以应对复杂场景。 目前,Cosmos Reason下载量已超过100万次,在Hugging Face的物理推理模型排行榜上位居榜首。该模型还能够筛选和标注大量真实及合成数据,用于模型训练。Cosmos Reason现已作为 NVIDIA NIM提供,NVIDIA NIM是一款易于使用的 AI 模型部署微服务。 这相当于形成了“模型+数据”的完整闭环。通过提供强大的基础模型和丰富的“养料”,NVIDIA正在降低顶尖机器人AI技术的门槛,吸引更多开发者在其生态内进行创新。 借助 NVIDIA Isaac GR00T N1.6,人形机器人可以同时完成移动和物体操控动作,其躯干和手臂拥有更大的活动自由度,能够完成各种高难度任务,比如推开较重的房门。 开发者还可以利用 Hugging Face 平台上的开源 NVIDIA 物理 AI 数据集,对 NVIDIA Isaac GR00T N 系列模型进行后训练。该数据集包含数千条合成及来自真实世界的轨迹数据,目前下载量已超过 480 万次。面向物理 AI 开发的全新 Cosmos 世界基础模型NVIDIA同时宣布了开源Cosmos世界基础模型(WFM的全新更新。该模型的下载量已超过300万次,开发者可通过文本、图像和视频提示,生成多样化数据,从而大规模加速物理AI 模型的训练。 即将推出的 Cosmos Predict 2.5 将三款 Cosmos 世界基础模型进行整合,集成为一个功能强大的模型,大幅降低了复杂度,节省开发时间并提高效率。它支持更长时长的视频生成(最长可创建 30 秒视频),同时提供多视角摄像头输出,以实现更丰富的世界仿真效果。 相比上一代模型,即将推出的 Cosmos Transfer 2.5生成结果速度更快、质量更高,而模型大小仅为上一代模型的 1/3.5。该模型能够根据真实的 3D 仿真场景和空间控制输入,比如深度信息、分割数据、边缘信息和高分辨率地图等,生成逼真的合成数据。训练机器人抓取技能的新工作流教会机器人抓取物体是机器人领域最具挑战性的任务之一。这不仅涉及机械臂的移动,还需要将抽象的指令转化为精准的动作,机器人必须通过反复试错才能掌握这项技能。 基于 NVIDIA Omniverse™ 构建的开发者预览版 NVIDIA Isaac Lab 2.3 新增了灵巧抓取工作流。该工作流通过自动化课程体系,在虚拟环境中对拥有多手指的机器人和机械臂进行训练,从简单任务开始,逐步提升难度。此工作流会调整重力、摩擦力、物体重量等参数,训练机器人在不可预测的环境中也能掌握技能。 Boston Dynamics的Atlas机器人借助这一工作流学习抓取技能,其操控能力得到了显著提升。包括 Agility Robotics、Boston Dynamics、Figure AI、Hexagon、Skild AI、Solomon 以及 Techman Robot 在内的领先的机器人公司,已经采用 NVIDIA Isaac 和 Omniverse 技术。在仿真环境中评估机器人的习得技能让机器人掌握一项新技能(如拿起杯子或穿过房间)非常困难,在实体机器人上测试这些技能不仅耗时且成本高昂。 仿真技术为解决这一问题提供了途径,它能够在无数场景、任务和环境中测试机器人习得的技能。但即便在仿真环境中,开发者构建的测试场景往往零散且简单化,无法真实反映现实世界的复杂情况。在完美且简单的仿真环境中学会导航的机器人,一旦面临现实世界的复杂状况就会失败。 为了让开发者无需从零构建系统,即可在仿真环境中开展复杂、大规模的评估,NVIDIA 与光轮智能联合开发了 NVIDIA Isaac Lab Arena——这是一个用于大规模实验和标准化测试的开源策略评估框架,该框架即将推出。全面支持,推进机器人研究进程为了让开发者充分利用这些先进的技术和软件库,NVIDIA 推出了专为高要求工作负载设计的 AI 基础设施,包括:NVIDIA GB200 NVL72、NVIDIA RTX PRO服务器、NVIDIA Jetson Thor等等。 CoRL 收录的论文中,近半数引用了 NVIDIA 的相关技术,包括 GPU、仿真框架和 CUDA 加速库。这些技术已被卡内基梅隆大学、华盛顿大学、苏黎世联邦理工学院和新加坡国立大学等领先研究实验室及机构广泛采用。 此次CoRL还重点展示了斯坦福视觉与学习实验室开展的机器人学习基准测试项目 BEHAVIOR,以及由北京大学开发的用于推进基于视觉的触觉机器人研究的高性能仿真平台 Taccel。

来源:与非网

相关推荐