摘要:它基于Rubin架构,单芯片设计,CUDA核心数量没公布,只是说配备四个NVENC编码器、四个NVDEC解码器用于视频工作流,搭配128GB GDDR7显存。
128GB显存的RTX 5090是没有的,不过128GB显存的AI GPU确实有。
我们知道,NVIDIA下一代GPU架构代号“Rubin”,明年才会正式登场。
但是现在,NVIDIA官方宣布了“Rubin CPX”,一款专门面向长窗口AI推理、智能体工作负载而打造的上下文处理型GPU。
它基于Rubin架构,单芯片设计,CUDA核心数量没公布,只是说配备四个NVENC编码器、四个NVDEC解码器用于视频工作流,搭配128GB GDDR7显存。
NVIDIA宣称,它在NVFP4数据精度下,计算性能最高30 PFlops(每秒3亿亿次),可以实现百万级token的推理。
同时,在长上下文处理场景下,它的注意力性能相比GB300 NVL72提升了最高3倍。
Rubin CPX今天只是纸面宣布,正式推出要等到2026年底——你没看错,是明年底。
NVIDIA日前透露,下代Rubin GPU、Vera CPU都已经在台积电完成流片,符合预期。
NVIDIA CFO Collette Cress表示:“Rubin平台的芯片已经在晶圆厂内,包括Vera CPU、Rubin GPU,以及配套的CX9 Super NIC网卡芯片、NVLink144/Spectrum X交换机芯片,还有用于整合封装的硅光芯片,其中Rubin GPU将于明年如期投入规模量产。”
流片是芯片开发过程中的关键一步,成功了就意味着芯片设计是符合预期的,接下来就可以试产样品,进行验证、测试、优化。
Rubin GPU、Vera CPU早在去年年中就已官宣,其中Rubin将接替现有的Blackwell、即将登场的升级版Blackwell Ultra。
Rubin的命名来源于美国女天文学家Vera Rubin(薇拉·鲁宾),将搭配下一代HBM4高带宽内存,8堆栈,首款产品R100,台积电3nm EUV工艺制造。
2027年还有它的升级版Rubin Ultra,升级为12堆栈HBM4内存,容量更大,性能更高。
如果不出意外,Rubin应该和Blackwell一样也是同时面向数据中心、消费级,RTX 60系列显卡也是基于它而来。
Vera CPU、Rubin GPU将组成新一代超级芯片,升级第六代NVLink互连总线,带宽高达3.6TB/s。
CX9 NIC数据中心网卡将升级1600Gbps带宽,也就是160万兆。
除了专门用于大规模上下文处理的Rubin CPX,NVIDIA还同时披露了新一代AI服务器,规模和性能实现了大幅度的跃升。
“Vera Rubin NVL144”定位于AI训练与推理用途的旗舰产品,应该每个机架配备36颗Vera CPU、144颗Rubin GPU,同时搭配1.4PB/s超高带宽的HBM4(容量没说),以及多达75TB存储。
算力性能在NVFP4数据精度下可高达3.5 EFlops,也就是每秒350亿亿次,对比GB300 NVL72提升3.3倍!
“Vera Rubin NVL144 CPX”又加入了72颗Rubin CPX,组成了单个机架144颗GPU、36颗CPU的庞大规模。
同时,它还有1.7PB/s带宽的HBM4内存、100TB高速存储,以及Quantum-X800 InfiniBand或者Spectrum-X以太网,搭配ConnectX-9 NIC网卡。
整机算力在NVFP4下达到了惊人的8 EFlops,即每秒800亿亿次,对比GB300 NVL72提升了7.5倍。
如果有需要,可以将两台服务器组合在一起,配置和算力直接翻倍。
NVIDIA号称,有了这样的AI服务器,每投入1亿美元,就可以换来50亿美元的收获。
NVIDIA最新公布的路线图显示,Rubin GPU和相关系统将在2026年底开始登场,2027年推出升级版Rubin Ultra,2028年则是全新的再下一代Feyman GPU,继续搭配Vera CPU。
有趣的是,AMD在GPU市场的影响力似乎一直不如其在CPU市场的表现,但该公司对其下一代AI GPU MI450寄予厚望,声称将实现“全方位的领先AI性能”。
在最近的高盛Communacopia+科技大会上,AMD数据中心解决方案业务部的执行副总裁Forrest Norrod介绍了MI450的计划。
他指出,MI450将是AMD无懈可击的GPU,AMD在MI300世代开始着手推理工作,在MI355中系统地构建训练能力。
“这一切都将在我们明年推出的MI450世代达到高潮,我们相信我们正在针对任何类型的AI工作负载,无论是训练还是推理,都瞄准了领先的性能。”
Norrod认为,MI450将成为AMD GPU的EPYC时刻,类似于该公司第三代 Zen CPU 架构在服务器市场的成功。
他说:“第三代EPYC CPU是我们的目标,它是任何x86工作负载的最佳 CPU,没有之一。我们正努力将MI450视为同样的产品。我们相信,并且我们计划让它成为市场上最佳的训练、推理、分布式推理、强化学习解决方案。”
至于与NVIDIA对比,Norrod明确表示,MI450不仅将超越当前的英伟达Blackwell架构,还将超越其下一代Rubin GPU。
虽然MI450不会用于游戏,但AMD计划将其AI和游戏GPU统一为单一架构,即UDNA,如果UDNA在AI方面超越NVIDIA,那么它在游戏GPU市场也将具有很强的竞争力。
来源:不秃头程序员