NVIDIA官宣新GPU Rubin CPX!多达128GB显存、推理性能达百万token

B站影视 内地电影 2025-09-27 09:21 1

摘要:它基于Rubin架构,单芯片设计,CUDA核心数量没公布,只是说配备四个NVENC编码器、四个NVDEC解码器用于视频工作流,搭配128GB GDDR7显存。

128GB显存的RTX 5090是没有的,不过128GB显存的AI GPU确实有。

我们知道,NVIDIA下一代GPU架构代号“Rubin”,明年才会正式登场。

但是现在,NVIDIA官方宣布了“Rubin CPX”,一款专门面向长窗口AI推理、智能体工作负载而打造的上下文处理型GPU。

它基于Rubin架构,单芯片设计,CUDA核心数量没公布,只是说配备四个NVENC编码器、四个NVDEC解码器用于视频工作流,搭配128GB GDDR7显存。

NVIDIA宣称,它在NVFP4数据精度下,计算性能最高30 PFlops(每秒3亿亿次),可以实现百万级token的推理。

同时,在长上下文处理场景下,它的注意力性能相比GB300 NVL72提升了最高3倍。

Rubin CPX今天只是纸面宣布,正式推出要等到2026年底——你没看错,是明年底。

NVIDIA日前透露,下代Rubin GPU、Vera CPU都已经在台积电完成流片,符合预期。

NVIDIA CFO Collette Cress表示:“Rubin平台的芯片已经在晶圆厂内,包括Vera CPU、Rubin GPU,以及配套的CX9 Super NIC网卡芯片、NVLink144/Spectrum X交换机芯片,还有用于整合封装的硅光芯片,其中Rubin GPU将于明年如期投入规模量产。”

流片是芯片开发过程中的关键一步,成功了就意味着芯片设计是符合预期的,接下来就可以试产样品,进行验证、测试、优化。

Rubin GPU、Vera CPU早在去年年中就已官宣,其中Rubin将接替现有的Blackwell、即将登场的升级版Blackwell Ultra。

Rubin的命名来源于美国女天文学家Vera Rubin(薇拉·鲁宾),将搭配下一代HBM4高带宽内存,8堆栈,首款产品R100,台积电3nm EUV工艺制造。

2027年还有它的升级版Rubin Ultra,升级为12堆栈HBM4内存,容量更大,性能更高。

如果不出意外,Rubin应该和Blackwell一样也是同时面向数据中心、消费级,RTX 60系列显卡也是基于它而来。

Vera CPU、Rubin GPU将组成新一代超级芯片,升级第六代NVLink互连总线,带宽高达3.6TB/s。

CX9 NIC数据中心网卡将升级1600Gbps带宽,也就是160万兆。

除了专门用于大规模上下文处理的Rubin CPX,NVIDIA还同时披露了新一代AI服务器,规模和性能实现了大幅度的跃升。

Vera Rubin NVL144”定位于AI训练与推理用途的旗舰产品,应该每个机架配备36颗Vera CPU、144颗Rubin GPU,同时搭配1.4PB/s超高带宽的HBM4(容量没说),以及多达75TB存储。

算力性能在NVFP4数据精度下可高达3.5 EFlops,也就是每秒350亿亿次,对比GB300 NVL72提升3.3倍!

“Vera Rubin NVL144 CPX”又加入了72颗Rubin CPX,组成了单个机架144颗GPU、36颗CPU的庞大规模。

同时,它还有1.7PB/s带宽的HBM4内存、100TB高速存储,以及Quantum-X800 InfiniBand或者Spectrum-X以太网,搭配ConnectX-9 NIC网卡。

整机算力在NVFP4下达到了惊人的8 EFlops,即每秒800亿亿次,对比GB300 NVL72提升了7.5倍。

如果有需要,可以将两台服务器组合在一起,配置和算力直接翻倍。

NVIDIA号称,有了这样的AI服务器,每投入1亿美元,就可以换来50亿美元的收获。

NVIDIA最新公布的路线图显示,Rubin GPU和相关系统将在2026年底开始登场,2027年推出升级版Rubin Ultra,2028年则是全新的再下一代Feyman GPU,继续搭配Vera CPU。

有趣的是,AMD在GPU市场的影响力似乎一直不如其在CPU市场的表现,但该公司对其下一代AI GPU MI450寄予厚望,声称将实现“全方位的领先AI性能”。

在最近的高盛Communacopia+科技大会上,AMD数据中心解决方案业务部的执行副总裁Forrest Norrod介绍了MI450的计划。

他指出,MI450将是AMD无懈可击的GPU,AMD在MI300世代开始着手推理工作,在MI355中系统地构建训练能力。

“这一切都将在我们明年推出的MI450世代达到高潮,我们相信我们正在针对任何类型的AI工作负载,无论是训练还是推理,都瞄准了领先的性能。”

Norrod认为,MI450将成为AMD GPU的EPYC时刻,类似于该公司第三代 Zen CPU 架构在服务器市场的成功。

他说:“第三代EPYC CPU是我们的目标,它是任何x86工作负载的最佳 CPU,没有之一。我们正努力将MI450视为同样的产品。我们相信,并且我们计划让它成为市场上最佳的训练、推理、分布式推理、强化学习解决方案。”

至于与NVIDIA对比,Norrod明确表示,MI450不仅将超越当前的英伟达Blackwell架构,还将超越其下一代Rubin GPU。

虽然MI450不会用于游戏,但AMD计划将其AI和游戏GPU统一为单一架构,即UDNA,如果UDNA在AI方面超越NVIDIA,那么它在游戏GPU市场也将具有很强的竞争力。

来源:不秃头程序员

相关推荐