摘要:官方口径写得很直白:NVFP4 算力最高 30 PFLOPs、注意力加速 3 倍,面向 100 万 token 等超长上下文场景,2026 年上柜,整机方案是 Rubin+Rubin CPX 的“解耦式推理”架构。
牙膏踩爆!近3万CUDA传闻来了,玩家该囤机还是等等看,Rubin CPX 这一刀把全行业捅穿了。
英伟达把“长上下文推理”单拎出来做了一张专用卡,128GB GDDR7、不用天价 HBM、图形管线没阉割,信息量拉满。
官方口径写得很直白:NVFP4 算力最高 30 PFLOPs、注意力加速 3 倍,面向 100 万 token 等超长上下文场景,2026 年上柜,整机方案是 Rubin+Rubin CPX 的“解耦式推理”架构。
这事对游戏卡的启发在于架构“可复用”。历史经验一再验证:数据中心芯片先走一步,消费级 GeForce 过一阵子换马甲复用核心思路。
Tweaktown、HotHardware 等媒体已经把话挑明:如果 Rubin CPX 的这套核显视频硬件、存储组织、调度路线下放,下一代 60 系的图形基因就有谱了。
现在的爆料给到一组很扎眼的数字:RTX 6090 传用 GR202,SM 从 5090 的 170 组拉到 224 组,等效 CUDA 核心 28,672,FP32 理论算力约 143.36 TFLOPS,比 5090 的 104.77 TFLOPS 多出三成多。
显存容量短期不冲 64GB,但全线换到 GDDR7,带宽从 1.8TB/s 提到 1.92TB/s。消息源强调“推测成分”,方向感很足。
我更在意的不是“跑分+30%”,而是“怎么来的”。Rubin 路线把 AI 推理拆成两段:上下文阶段吃算力、生成阶段吃带宽,于是 CPX 选 GDDR7 这条更便宜的路;标准 Rubin 继续走 HBM4 的高带宽堆料。
对消费者的暗示很清楚:GDDR7 的频率和能效空间还没掘干,显卡厂商可以在成本、功耗、面积之间做更灵活的平衡。AI 卡降本,游戏卡够快,这是产业链的现实解法。
价格这道题八成不好看。3nm 工艺带来的晶体管密度、良率、封装堆栈,全是实打实的成本项。
RTX 90 系一向是“技术展示位+利润担当”,再加散热、供电、PCB 层数,旗舰价位再抬一级并不意外。市场侧流传“晚 2026 上市、双 16Pin、600W 等级供电”的风声,玩家要提前把电源、机箱风道和电费表算进去。
GDDR7 其实被低估了。很多人拍脑袋就问“为啥不上 64GB”,但 32GB+更高速率的现实好处是不挤显存颗粒、不显著增厚 PCB,还能少一点功耗墙。
更重要的是显存控制器和缓存层级的联动优化——Rubin 系在服务端已经用“带宽/算力解耦”去喂长上下文,这种“按场景精准投喂”的设计思想如果迁移到游戏场景,未来在 4K 光追+AI 超分+生成式降噪的一体化流水线上,带宽瓶颈没那么容易卡死。
视频链路同样值得盯。CPX 每颗 die 给到四路 NVENC/NVDEC,这不是只为数据中心准备的花瓶,创作端剪辑、直播、编码、AI 视频生成都会吃到甜头。
要是真下放到 6090,创作者会比纯游戏玩家更先感知到价值:高码率素材处理更稳、代理更少、时间线更顺,GPU 加速的滤镜和 AI 工具也能拉满。
要不要等等 6090,我给三把尺子。玩 2K 144Hz 的纯竞技玩家,5090 甚至 4080S 都完全够用;
追 4K 光追极致画质,还想开 DLSS3.5+帧生成+路径追踪的发烧友,可以观望 6090 的首批能耗曲线,真能把“持续帧率”压稳再下手也不迟;
做本地 AI 生成、SD/ComfyUI、视频生成的创作党,一边看 6090 的价格、功耗、一边留心 Rubin 系列在推理上的新指令和张量格式,NVFP4 在服务端是“性价比核弹”,消费卡若给到类比的低精度推理通路,效率会非常夸张。
别忽视平台连坐效应。CPU 会不会成瓶颈、主板 PCIe 带宽给不给力、电源是否真 80+ 金牌以上、机箱有没有足够的冷排位置,这些都决定 6090 的“到手体验”。以前是显卡一卡通吃,现在更像整机协同工程。
我个人的态度偏“实用主义”。已经拿到 5090,先把手里大作玩痛快,等到 6090 的真实功耗、噪音、定价都明朗;预算厚、追顶级,愿意为“稳定的 4K 光追帧率+创作加速”付费,那就预留 1000W 以上电源和充足散热,准备迎接一代“更贵也更强”的旗舰。
最后抛个讨论题,方便你在评论区拉投票:如果 6090 性能比 5090 高 30%,价格贵 20%,你会冲吗?
你更看重 4K 光追的稳帧,还是电费账单的压力?
如果 3nm 首发带来驱动波动,你能接受多长的“磨合期”?
欢迎把你的理由写清楚,评论区聊一聊!
来源:小8说科技