摘要:在人工智能从虚拟向物理世界的延伸中,NVIDIA正以迅猛姿态引领变革。2025年9月30日,在韩国首尔举行的机器人学习大会(CoRL)上,NVIDIA发布了一系列针对人形机器人和物理AI的升级工具,这些创新旨在为机器人提供“头脑、身体和训练场”,加速其在不确定
在人工智能从虚拟向物理世界的延伸中,NVIDIA正以迅猛姿态引领变革。2025年9月30日,在韩国首尔举行的机器人学习大会(CoRL)上,NVIDIA发布了一系列针对人形机器人和物理AI的升级工具,这些创新旨在为机器人提供“头脑、身体和训练场”,加速其在不确定环境中的推理、适应和安全行动。这一波公告包括Project GR00T的最新迭代、Newton物理引擎以及Cosmos世界基础模型的优化,标志着NVIDIA从GPU巨头向机器人生态构建者的全面转型。行业专家认为,在全球人形机器人市场预计2025年增长40%的背景下,这些工具不仅填补了模拟与现实的鸿沟,还为开发者提供了标准化路径,推动物理AI从实验室走向工业应用。
NVIDIA的Omniverse平台作为核心训练环境,进一步强化了这一战略。通过这些升级,人形机器人能更好地处理复杂任务,如在多变地形上的导航或精细物体操作,潜在应用覆盖制造业、医疗护理和家庭服务。NVIDIA Omniverse与模拟技术副总裁Rev Lebaredian强调:“人形机器人是物理AI的下一个前沿,需要推理、适应并在不可预测世界中安全行动。这些最新更新为开发者提供了三个关键计算机——Isaac GR00T作为机器人的大脑、Newton模拟其身体,以及NVIDIA Omniverse作为训练场——将机器人从研究带入日常生活。”
英伟达
Project GR00T作为NVIDIA的人形机器人基础模型,已迭代至N1.6版本,这一开源模型现已在Hugging Face平台免费获取。它集成了NVIDIA的视觉语言模型Cosmos Reason,能将模糊指令转化为分步计划,利用先验知识、常识和物理原理处理新情境,并泛化到多任务场景。例如,在面对“捡起地上的苹果”这样的命令时,GR00T N1.6不仅规划路径,还考虑重力和摩擦等变量,确保动作自然流畅。
从工程角度剖析,GR00T N1.6的进步源于多模态融合架构:结合Transformer和扩散模型的混合框架,提升了推理的因果性。相比N1.5版本,其泛化能力提升25%,通过强化学习优化了边缘案例处理,如光线变化或物体变形。这种开源策略降低了开发者门槛,早前采用者包括Lightwheel、Neura Robotics和LG Electronics等机器人公司,以及ETH Zurich机器人系统实验室、慕尼黑工业大学和北京大学等研究机构。这些伙伴已将GR00T用于原型开发,测试显示,在模拟仓库分拣任务中,成功率达92%,远超传统规则-based系统。
行业专家观察到,GR00T的开源模式类似于Hugging Face上的Llama系列,但专为物理AI定制,强调实时决策而非纯文本生成。这不仅加速了生态构建,还为中小型机器人初创提供了竞争机会,推动人形机器人从单一任务向通用智能的演进。
Newton物理引擎是另一大亮点,由NVIDIA与Google DeepMind及Disney Research联合开发,这一开源工具模拟复杂动作,如在雪地或碎石上行走,或处理小型/可变形物体。它通过高保真物理建模,生成多样化训练数据,避免现实测试的成本和风险。举例而言,Newton能精确模拟球体滚动时的能量损失或布料折叠的褶皱动态,适用于柔性机器人臂的设计。
与Newton协同的是Cosmos世界基础模型的更新,这些模型支持从文本、图像或视频提示生成合成训练数据,加速物理AI模型的规模化训练。Cosmos的生成效率提升30%,通过生成对抗网络(GAN)变体,确保数据多样性覆盖边缘场景,如低光环境或多物体交互。NVIDIA Omniverse作为“训练场”,无缝桥接模拟与现实,支持零样本迁移——即模型在虚拟中习得技能,直接应用于物理机器人。
工程上,这一栈依赖高性能计算:Newton的粒子系统模拟需数千GPU小时,但Cosmos的边缘优化将训练时间缩短至几天。行业专家指出,这种模拟-现实(Sim2Real)范式是物理AI的瓶颈突破,类似于DeepMind的MuJoCo引擎,但NVIDIA的集成更注重工业级鲁棒性。早期测试显示,使用Newton训练的机器人臂在真实装配线上错误率降至5%以下,预示着制造业的自动化浪潮。
NVIDIA的这些工具,正值人形机器人市场爆发期。2025年,全球人形机器人出货量预计超10万台,物理AI投资达500亿美元,驱动因素包括劳动力短缺和老龄化社会。NVIDIA的生态布局——从Jetson Orin硬件到Omniverse云服务——覆盖全链条,早前与Figure AI和Agility Robotics的合作已验证其商业潜力。相比特斯拉Optimus的闭源路径,NVIDIA的开源策略更利于标准化,推动行业从碎片化向统一框架演进。
然而,挑战并存。物理AI的安全性仍是痛点,GR00T N1.6虽融入常识推理,但边缘故障如意外碰撞需进一步强化。能源效率也是焦点,人形机器人的功耗可达数千瓦,Newton的模拟需优化以支持低功耗边缘部署。在我国市场,NVIDIA工具或与华为Ascend生态融合,加速本土机器人如优必选的升级,预计渗透率升至25%。行业专家预测,到2030年,物理AI将主导服务机器人领域,NVIDIA的“三大计算机”框架或成为行业标杆,但需警惕开源滥用风险,如模型泛化偏差。
从更广视角,这些创新惠及下游应用:医疗机器人通过GR00T实现个性化护理,物流臂借助Newton处理不规则包裹。这种发展趋势将重塑人力密集行业,推动从刚性自动化向柔性智能的转型。
NVIDIA在CoRL大会上的GR00T N1.6、Newton引擎和Cosmos模型发布,以其开源创新和模拟深度,铸就了人形机器人从概念到部署的桥梁。这一战略不仅加速了物理AI的商业化,还为开发者提供了前所未有的工具栈。行业专家坚信,NVIDIA的“头脑、身体、训练场”框架将驱动2025年机器人浪潮,推动行业向更适应、更安全的智能时代迈进,成为定义人形未来的一座里程碑。
来源:万物云联网