NVIDIA官宣新GPU Rubin CPX！多达128GB显存、推理性能达百万token

B站影视内地电影 2025-09-27 09:21 14

摘要：它基于Rubin架构，单芯片设计，CUDA核心数量没公布，只是说配备四个NVENC编码器、四个NVDEC解码器用于视频工作流，搭配128GB GDDR7显存。

128GB显存的RTX 5090是没有的，不过128GB显存的AI GPU确实有。

我们知道，NVIDIA下一代GPU架构代号“Rubin”，明年才会正式登场。

但是现在，NVIDIA官方宣布了“Rubin CPX”，一款专门面向长窗口AI推理、智能体工作负载而打造的上下文处理型GPU。

它基于Rubin架构，单芯片设计，CUDA核心数量没公布，只是说配备四个NVENC编码器、四个NVDEC解码器用于视频工作流，搭配128GB GDDR7显存。

NVIDIA宣称，它在NVFP4数据精度下，计算性能最高30 PFlops(每秒3亿亿次)，可以实现百万级token的推理。

同时，在长上下文处理场景下，它的注意力性能相比GB300 NVL72提升了最高3倍。

Rubin CPX今天只是纸面宣布，正式推出要等到2026年底——你没看错，是明年底。

NVIDIA日前透露，下代Rubin GPU、Vera CPU都已经在台积电完成流片，符合预期。

NVIDIA CFO Collette Cress表示：“Rubin平台的芯片已经在晶圆厂内，包括Vera CPU、Rubin GPU，以及配套的CX9 Super NIC网卡芯片、NVLink144/Spectrum X交换机芯片，还有用于整合封装的硅光芯片，其中Rubin GPU将于明年如期投入规模量产。”

流片是芯片开发过程中的关键一步，成功了就意味着芯片设计是符合预期的，接下来就可以试产样品，进行验证、测试、优化。

Rubin GPU、Vera CPU早在去年年中就已官宣，其中Rubin将接替现有的Blackwell、即将登场的升级版Blackwell Ultra。

Rubin的命名来源于美国女天文学家Vera Rubin(薇拉·鲁宾)，将搭配下一代HBM4高带宽内存，8堆栈，首款产品R100，台积电3nm EUV工艺制造。

2027年还有它的升级版Rubin Ultra，升级为12堆栈HBM4内存，容量更大，性能更高。

如果不出意外，Rubin应该和Blackwell一样也是同时面向数据中心、消费级，RTX 60系列显卡也是基于它而来。

Vera CPU、Rubin GPU将组成新一代超级芯片，升级第六代NVLink互连总线，带宽高达3.6TB/s。

CX9 NIC数据中心网卡将升级1600Gbps带宽，也就是160万兆。

除了专门用于大规模上下文处理的Rubin CPX，NVIDIA还同时披露了新一代AI服务器，规模和性能实现了大幅度的跃升。

“Vera Rubin NVL144”定位于AI训练与推理用途的旗舰产品，应该每个机架配备36颗Vera CPU、144颗Rubin GPU，同时搭配1.4PB/s超高带宽的HBM4(容量没说)，以及多达75TB存储。

算力性能在NVFP4数据精度下可高达3.5 EFlops，也就是每秒350亿亿次，对比GB300 NVL72提升3.3倍！

“Vera Rubin NVL144 CPX”又加入了72颗Rubin CPX，组成了单个机架144颗GPU、36颗CPU的庞大规模。

同时，它还有1.7PB/s带宽的HBM4内存、100TB高速存储，以及Quantum-X800 InfiniBand或者Spectrum-X以太网，搭配ConnectX-9 NIC网卡。

整机算力在NVFP4下达到了惊人的8 EFlops，即每秒800亿亿次，对比GB300 NVL72提升了7.5倍。

如果有需要，可以将两台服务器组合在一起，配置和算力直接翻倍。

NVIDIA号称，有了这样的AI服务器，每投入1亿美元，就可以换来50亿美元的收获。

NVIDIA最新公布的路线图显示，Rubin GPU和相关系统将在2026年底开始登场，2027年推出升级版Rubin Ultra，2028年则是全新的再下一代Feyman GPU，继续搭配Vera CPU。

有趣的是，AMD在GPU市场的影响力似乎一直不如其在CPU市场的表现，但该公司对其下一代AI GPU MI450寄予厚望，声称将实现“全方位的领先AI性能”。

在最近的高盛Communacopia+科技大会上，AMD数据中心解决方案业务部的执行副总裁Forrest Norrod介绍了MI450的计划。

他指出，MI450将是AMD无懈可击的GPU，AMD在MI300世代开始着手推理工作，在MI355中系统地构建训练能力。

“这一切都将在我们明年推出的MI450世代达到高潮，我们相信我们正在针对任何类型的AI工作负载，无论是训练还是推理，都瞄准了领先的性能。”

Norrod认为，MI450将成为AMD GPU的EPYC时刻，类似于该公司第三代 Zen CPU 架构在服务器市场的成功。

他说：“第三代EPYC CPU是我们的目标，它是任何x86工作负载的最佳 CPU，没有之一。我们正努力将MI450视为同样的产品。我们相信，并且我们计划让它成为市场上最佳的训练、推理、分布式推理、强化学习解决方案。”

至于与NVIDIA对比，Norrod明确表示，MI450不仅将超越当前的英伟达Blackwell架构，还将超越其下一代Rubin GPU。

虽然MI450不会用于游戏，但AMD计划将其AI和游戏GPU统一为单一架构，即UDNA，如果UDNA在AI方面超越NVIDIA，那么它在游戏GPU市场也将具有很强的竞争力。

来源：不秃头程序员

标签： nvidia gpu 显存 cpx 128gb显存

本文地址：http://news.43b.com.cn/a/1379158.html

免责声明：本站系转载，并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题，请在30日内与本站联系，我们将在第一时间删除内容!