摘要:SIGGRAPH(国际计算机图形与交互技术会议)一直致力于推动计算机图形学与交互技术的发展,连接“物理世界”与“数字世界”,涵盖虚拟现实、增强现实、神经渲染、物理AI等前沿方向,也是诸多PC图形行业及AI产业的领袖厂商每年展现技术实力的最好阵地。作为当前AI领
SIGGRAPH(国际计算机图形与交互技术会议)一直致力于推动计算机图形学与交互技术的发展,连接“物理世界”与“数字世界”,涵盖虚拟现实、增强现实、神经渲染、物理AI等前沿方向,也是诸多PC图形行业及AI产业的领袖厂商每年展现技术实力的最好阵地。作为当前AI领域的龙头企业以及SIGGRAPH一直以来的“技术首秀SVIP”,在刚刚拉开帷幕的2025年SIGGRAPH大会上,NVIDIA以Blackwell硬件为基,AI模型与工具为翼,生态合作为驱,持续深化“智能体AI+物理AI”布局,借由一系列全新硬件与技术的发布,推动计算机图形学从“数字创作”向“物理世界交互”跨越,展现了NVIDIA加速AI技术的工业化落地决心。
在今年的SIGGRAPH大会上,NVIDIA非常清晰地传递出了其在AI领域的三大技术战略思想:AI基础设施(AI Infrastructure)、智能体AI(AGENTIC AI)以及物理AI(Physical AI),同时也传递了“从硬件到软件、从模型到生态”的创新思维。从NVIDIA的SIGGRAPH 2025首秀技术信息分享来看,NVIDIA正通过“算力+模型+工具+生态”的协同作战思维,持续深化在智能体AI和物理AI领域的布局,加速AI技术从“实验性创新”向“工业化应用”的跨越。
正式发布AI相关新产品与技术之前,NVIDIA在大会上首先展示了计算机图形学到物理AI的演进,通过时间线串联核心技术节点,展现图形学与AI融合的发展脉络。从“图形学技术积累”(渲染、可编程、硬件),到“AI与图形学双向赋能”(AI加速图形,图形数据反哺AI),再到“物理AI的工业级突破”(AI进入现实世界,实现交互与控制)。NVIDIA清晰地表明了技术迭代的核心是“算力、算法、数据”的协同进化,最终推动计算机图形学从“数字创作工具”升级为“物理世界的AI交互引擎”。
NVIDIA RTX PRO Blackwell产品家族发布:面向企业级AI与图形处理的统一平台NVIDIA首先发布了全新的RTX PRO这一以Blackwell架构为核心的专业GPU,推出了RTX PRO 服务器(面向企业数据中心)和紧凑型工作站 GPU(覆盖边缘场景),打通“云端-边缘”算力通道。
首先是RTX PRO系列GPU中的旗舰产品NVIDIA RTX PRO 6000 Blackwell Server Edition,NVIDIA通过这一GPU将Blackwell架构引入全球最普及的企业系统,为智能体AI和物理AI提供超强算力性能。NVIDIA以“硬件(Blackwell架构RTX PRO GPU)+性能(45倍加速)+生态(主流厂商联盟)”为抓手,推动企业数据中心从“传统CPU集群”向“AI加速基础设施”升级,聚焦企业级AI与专业图形工作负载(如智能体训练、物理 AI 模拟、高精度渲染),加速AI技术在工业、科研、设计等领域的规模化落地。全新RTX PRO(Blackwell)服务器的出现,带来了数据中心的算力革新,针对加速计算工作负载(如数据分析、模拟、渲染等),基于RTX PRO 6000 Blackwell的GPU集群服务器性能相比传统的CPU集群服务器提升高达45倍。企业可通过RTX PRO服务器将数百台纯CPU服务器整合为少量GPU加速服务器,实现“数据中心整合”—— 降低硬件成本、减少能耗、压缩机房空间占用。目前NVIDIA已经公布了思科(Cisco)、戴尔科技(Dell Technologies)、HPE、联想(Lenovo)、超微(Supermicro)等五大全球顶尖IT厂商将同步支持RTX PRO服务器,保障产品快速进入企业级市场。
除了主要服务于企业级的RTX PRO服务器之外,Blackwell架构的RTX PRO GPU也赋能了紧凑型工作站,并推出了两款产品——NVIDIA RTX PRO 4000 Blackwell SFF Edition和RTX PRO 2000 Blackwell Edition。
RTX PRO 4000 Blackwell SFF Edition和RTX PRO 2000 Blackwell Edition这两款GPU专为小型四插槽系统机箱设计,由OEM工作站供应商提供,采用紧凑设计,总功耗仅需70瓦。其中RTX PRO 4000 Blackwell SFF Edition配置了24GB w/ECC GDDR 7显存,能提供770AI TOPS的算力。与上一代RTX 4000 SFF ADA Generation GPU相比,RTX PRO 4000 Blackwell SFF Edition的渲染性能提升3倍,LLM推理性能提升4倍,AI图像生成性能则提升了6倍,首发价格约1500美元。
RTX PRO 2000 Blackwell Edition的定位相对低一些,它配置了16GB w/ECC GDDR 7显存,能提供545 AI TOPS的算力,首发价格约700美元。与上一代 RTX 2000 Ada Generation GPU相比,RTX PRO 2000 Blackwell Edition的渲染性能提升1.5倍,LLM 推理性能提升2倍,AI图像生成性能提升4倍。
NVIDIA公布的这两款Blackwell架构RTX PRO专业GPU都搭载了第四代光追技术、FP4 AI精度、DLSS 4(深度学习超级采样技术4)和神经着色器等Blackwell架构的技术特色,旨在满足当今现代工作负载需求,如AI驱动的工作流(生成式设计、AI 辅助编码、渲染与可视化、科学及工程模拟等)。不过NVIDIA在会上并未公布Blackwell架构RTX PRO GPU的更多技术细节和详细规格配置,只能等NVIDIA的进一步消息公布了。
NVIDIA看来,如今AI领域的迅猛发展正推进到代理式人工智能(AGENTIC AI,AI代理),而下一个AI风口——物理AI已近在眼前。
开源AI模型正加速全球AI创新革命,开源模型为社区带来了突破性进展,例如Deep Seek R1、Llama、Nemotron和Queen 3模型的推理能力为AI发展做出了巨大贡献。
NVIDIA向开源社区贡献了许多顶级模型,其中Nemotron模型的训练后数据集目前在 Hugging Face上成了大热门,同时NVIDIA Nemotron模型能为任何模型提供性能增强。借SIGGRAPH 2025大会之际,NVDIAI也正式宣布Nemotron系列新增两款模型。
新发布的NVIDIA Nemtron家族模型包括Nemotron Nano 2以及Llama Nemtron Super 1.5。新的开源Nemotron模型基于开放透明的数据训练,在同规模模型中针对复杂任务实现了最高精度。其采用全新混合架构和可配置“思考预算”功能,可在AI的深度推理与高效工作之间取得平衡。
Nemotron Nano 2模型在相同时间内可生成多达6倍的词元token,且推理成本较同类其他开源模型降低60%;Llama Nemotron Super 1.5现已支持Blackwell架构的NVFP4精度,吞吐量较Hopper架构的FPA提升6倍。从NVIDIA在会上公布的消息来看,Nemotron Nano 2和 Llama Nemotron Super 1.5模型 即将在Bill、NVIDIA及Hugging Face等官网或社区上线,多家大型软件厂商也已采用Nemotron模型,如Crowdstrike、NetApp以及ZOOM等。
物理AI(Physical AI):AI产业的下一个热点,基于智能机器人的物理世界交互物理AI(Physical AI)是NVIDIA认定的AI领域的下一个风口浪尖,同时还特别指出物理AI将会成为下一个万亿美元级市场,前景一片大好。因此在本次SIGGRAPH 2025大会上,NVIDIA也向业界公布了它们在这一领域的最新进展,包括全新或升级的硬件、软件相关技术信息。
物理AI是能够导航并与物理世界交互的模型,NVIDIA在会上指出其将体现为三类主要的智能机器人:工厂与仓库等设施机器人、运输机器人以及人形机械手与自主移动机器人(AMR)。不同于传统AI语言模型(从文本或图像提示生成文本或视频帧),物理AI基于感官输入和意图来生成下一步动作。对此,NVIDIA也给出了构建物理AI需要的技术架构,涵盖模拟(Simulate)、训练(Train)和部署(Deploy)三大环节,分别对应不同的计算平台,构建起从虚拟场景模拟、模型训练到实际部署应用的完整流程,支撑物理AI和机器人技术研发迭代 。
模拟(SIMULATE):借助NVIDAI Omniverse与基于RTX PRO的Cosmos(及相关开发工具、框架平台),用于模拟和测试物理AI模型,生成海量合成物理数据;
训练(TRAIN):依托NVIDIA DGX和HGX超级计算系统,用于训练 AI 模型;
部署(DEPLOY):运用NVIDIA Jetson Thor AGX等边缘计算平台实现落地应用。
NVIDIA认为,当今机器人领域最大的挑战是数据难题。和大语言模型LLM这种拥有全球互联网数据用于预训练不一样,物理AI的真实世界数据采集成本高、潜在风险大。因此NVIDIA认为模拟技术在物理AI领域将有超强的用武之地——机器人大脑可在虚拟世界中学习和练习技能。NVIDIA在会上指出,物理AI学习技能需三个步骤,而NVIDIA也为开发者免费提供可集成到工具与工作流中的开源库、框架和模型:
世界重建(World Reconstruction):捕获、组装或重构世界,提供逼真的虚拟训练环境;
世界生成(World Generation):扩充和随机化虚拟环境,生成无限版本的训练场景;
世界理解(World Understanding):为物理AI提供先验知识、常识和推理能力。
NVIDIA为物理AI构建的每个步骤发布了相应的库和模型。首先是重建世界,这一步骤难度极大,需要大量3D创作者手工建模、应用材质和物理属性,无法手动扩展;而在Carla或Isaac Sim等模拟器中组装虚拟训练场景时,需整合来自真实世界采集、各类CAD工具或其他机器人模拟框架的多类型数据。为此,NVIDIA发布了突破性的神经重建库New Omniverse NuRec,包含用于重建、渲染和增强的库与AI模型,它能将真实世界传感器数据转换为可完全交互的模拟场景,借助Omniverse RTX渲染器添加光线追踪,实现逼真的光照和传感器行为,这对基于感知的机器人至关重要。
同时,NVIDIA还推出了新的开源USD库,实现创作与基于USD的应用(如合作伙伴Intrinsic、Visual Components的产品,或开源的NVIDIA Isaac Sim)之间的数据互操作性。连接到USD的工具越多,开发者、机器人专家和3D用户就越容易跨生态系统迁移数据,也越容易构建基于物理的世界数字孪生——这是制造机器人的核心需求。NVIDIA已在开源机器人模拟框架Isaac Sim和Isaac Lab中启用New Omniverse NuRec和USD库,目前已在GitHub开放使用。
在物理AI的世界生成环节,NVIDIA在本次大会上也宣布了对用于世界生成的Cosmos世界基础模型进行两项更新:
Cosmos Transfer:输入Isaac Sim中的3D世界和文本提示,可生成无限量随机场景,供开发者用于数据增强;
Cosmos Predict:一种世界模型,输入图像或起始视频即可预测视频后续内容,生成未来世界状态。
NVIDIA表示,这些模型在物理AI开发者中极受欢迎,自1月发布以来下载量已超200万次。目前NVIDIA正与众多合作伙伴合作,针对其特定需求优化模型。
最后来看NVIDIA在物理AI的世界理解部分的努力。4年前,OpenAI推出了全球首个视觉语言模型(VLM)CLIP,从此VLM改变了物体识别、模式识别等计算机视觉任务,但它缺少一项关键能力:无法理解或推理多样化、未见过的“长尾”场景问题。
在本次大会上,NVIDIA发布了Cosmos Reason——一款开源、可商用的推理型 VLM,能像人类一样利用先验知识、物理定律理解和物理交互常识进行思考。它能完成非推理型VLM无法实现的任务,如解决多步骤任务、处理歧义或全新未见过的场景。其性能在排行榜中位居前列,且开源可完全定制;70 亿参数规模使其非常适合物理AI边缘和机器人部署——从摄像头到交通灯,所有具备视觉能力的智能物联网设备,所有家庭或工业机器人,现在都能通过Cosmos Reason实现推理。
从NVIDIA公布的技术信息来看,我们认为Cosmos Reason彻底改变了物理 AI 中三个最复杂、最艰巨的工作流:
数据创建与标注:当前的数据标注和整理依赖人工与非推理型VLM结合,速度慢、质量低,且非推理型VLM无法推断场景中的复杂交互;借助Cosmos Reason,可实现大规模、超高质量的多样化训练数据集自动化整理与标注。
机器人规划与常识:Cosmos Reason作为VLM,能使机器人像人类一样通过指令推理并处理未见过的场景。例如,当对其说出“能帮我做点烤面包片吗”,搭载推理型VLM的机器人会识别烤面包机和面包,将模糊请求转化为具体计划:通过常识判断“一些”指两片或更多面包,选择中等烤度(最常见偏好),并理解用户意图是“享用成品食物”,进而找到盘子并呈给用户。
视频分析代理:Cosmos Reason现已集成到热门的视频搜索与摘要框架中,使开发者能构建视觉AI代理,从海量录制视频数据和直播流中提取警报、有价值见解并进行根因分析。未来,视频代理将无处不在,实现交通监控自动化、提升安全性、增强从工业设施到整个城市的视觉巡检能力。
NVIDIA从软硬两方面为AI产业的发展添砖加瓦。一是即将由全球系统制造商推出的NVIDIA RTX PRO服务器 ,二是已在微软Azure上线、接入DGX云的NVIDIA Omniverse,二者共同为高要求的物理AI工作负载提供算力支撑 ,助力相关场景的 AI 应用开发与运行 。
写在最后总体而言,从本次SIGGRAPH的NVIDIA技术产品信息公布来看,NVDIA在AI领域,尤其是物理AI领域的布局是全面且深入的。它通过推出一系列先进的模型、库、基础设施以及硬件产品,为AI开发者搭建了一个功能强大且完善的生态系统。从模拟环节的Omniverse与 Cosmos Transfer助力虚拟场景构建与数据生成,到训练阶段借助DGX和HGX等强大算力加速模型训练,再到部署时利用Jetson Thor AGX实现边缘计算应用,这一闭环流程极大地推动了AI及机器人技术的融合发展。特别是Cosmos Reason等模型的推出,赋予了机器人更强的“推理”能力,开启了机器人智能化的新篇章。随着NVIDIA不断深入AI领域,其有望持续引领行业变革,为AI技术在更多场景的应用与拓展提供源源不断的动力,也必将促使更多企业和开发者投身于AI领域的创新实践,共同塑造AI世界的未来蓝图。
友情提示来源:微型计算机