摘要:在GTC 2025大会中,Nvidia首席执行官黄仁勋发布Blackwell Ultra,锁定AI工厂的AI运算平台,以加速AI推理、代理型AI及物理型AI(Physical AI),其中的GB300 NVL72要比GB 200 NVL72的AI性能高出1.5
在GTC 2025大会中,Nvidia首席执行官黄仁勋发布Blackwell Ultra,锁定AI工厂的AI运算平台,以加速AI推理、代理型AI及物理型AI(Physical AI),其中的GB300 NVL72要比GB 200 NVL72的AI性能高出1.5倍,与Hooper相比则提高50倍。此外,该公司也发布首个开放的人形机器人基础模型Isaac GR00T N1,强化人形机器人的推理能力。
黄仁勋在主题演说中指出,AI技术正从先前的认知AI到生成式AI,往代理AI及物理AI发展,愈往后发展,AI具备更高的智慧,例如物理AI技术的发展,让AI能更好的理解实体环境的3D世界,同时驱动AI机器人的发展,每个阶段的发展都会带来商机,但是愈往后发展,就需要解决三个基本的问题,如何获得数据、如何在没有人类限制下训练模型,以及AI推理能力需要更大的扩展(Scaling)训练,需要更大的运算,超过一年前相同时所预期的100倍。
鉴于更复杂的AI推理能力所需的运算性能,Nvidia发布Blackwell Ultra,用来加强训练及测试时间扩展推理(Test-time scaling inference),Blackwell Ultra是基于先前的Blackwell架构,但采用性能更高的GB300 NVL72及HGX B300 NVL16。
其中GB300 NVL72采NVlink连接72个Blackwell Ultra GPU及36个Grace CPU,GB300 NVL72的AI性能比GB 200 NVL72高出1.5倍;而HGX B300 NVL16则比Hopper,运算性能提升7倍,而在大型语言模型的推理速度则提升11倍,内存也增加4倍,以应对较复杂的运算负载需要。
“AI已取得巨大的发展,推理及代理AI需要更多的运算性能,Blackwell Ultra可以高效地完成预训练、后训练、推理AI的推论”,黄仁勋说。
相较于传统的LLM,产生的Token较少,对问题的回应容易出错,推理模型能够产生更多的Token,从而提高回应的准确性,但相对地也需要更大的运算性能,因此Nvidia强调Blackwell Ultra的性能有助于AI的扩展推理能力,可将复杂的问题拆解成多个步骤,探索不同的解决方式,来提高回应的品质。
除了有助于AI的推理能力发展,也有助于物理AI技术发展,像是即时生成拟真的形象,以大规模的训练机器人、自动驾驶汽车,Nvidia也在GTC中宣布将和美国的GM汽车在自动驾驶汽车技术进行合作。
Blackwell Ultra预计在2025年下半年提供,Nvidia披露思科、戴尔、HPE、联想、华硕、富士康、技嘉、和硕、广达等将推出相关系统,AWS、GCP、Azure等云计算服务企业将会提供运算服务。
考虑到横向扩展的需要,Blackwell Ultra未来可搭配Nvidia Spectrum-X以太网络及Nvidia Quantum-X800 Infiniband,通过Nvidia ConnectX-8 SuperNIC,让每个GPU的数据吞吐量达到800Gbps。
为加速推理AI技术,Nvidia也推出开源推理框架Nvidia Dynamo,针对部署数千个GPU的AI工厂,GPU间的沟通协调工作,将大型语言模型的处理、生成分派到不同的GPU,缩短回应时间,并且降低服务的成本。
Blackwell Ultra之后,Nvidia也如先前所承诺的,以一年一更新的步调,揭示未来两年的产品篮图,2026年下半年将推出Vera Rubin NVL144,性能为GB300 NVL72的3.3倍,内存容、带宽、NVLink速度也有至少1.6倍的提升;接下来,2027年下半年将推出Rubin Ultra NVL576,性能比GB300 NVL72提高14倍,搭配NVLink7、CX9,大幅提升内存、带宽速度。
针对物理AI,黄仁勋认为,物理AI将会驱动机器人、自动驾驶汽车等科技快速发展,创造出新一波的机器人商机,其中人形机器人,不论在家庭生活协助或是工厂自动化生产,预期会有相当的需求。
因此Nvidia也发布首个针对人形机器人的开放基础模型,GTC发布Isaac GR00T N1,这个模型标榜为目前全球第一个开放、可自订的通用人形机器人推理及技能基础模型,N1集成视觉语言模型及集成Transformer的扩散模型,让机器人可接受sensor token(例如形象)及text token(语言命令),经过集成Transformer扩散模型处理后,产生action token,让机器人采取行动。
该公司也和Google DeepMind、Disney Research联手开发机器人引擎Newton,以星球大战中的BDX机器人为模仿,该机器人的头部及双脚可以自主移动,不只是静态的模拟画面展示,现场也安排Newton机器人升上舞台,即时与黄仁勋互动,这款只到成人大腿左右高度的机器人摇头晃脑外,还能依照黄仁勋的指示,移动到指定的位置,描绘物理AI技术下,可与人类互动的人形机器人在生活中已不再遥远。
来源:十轮网