摘要:2025年1月23号,也就是昨天,NVIDIA RTX 5090正式解禁!只是这款显卡无法在内地销售,我们拿到的是RTX 5090D,这也导致了我们的首发评测比国外同行晚了一天!
一、前言:主要规格几乎一刀未砍的RTX 5090D
2025年1月23号,也就是昨天,NVIDIA RTX 5090正式解禁!只是这款显卡无法在内地销售,我们拿到的是RTX 5090D,这也导致了我们的首发评测比国外同行晚了一天!
但和RTX 4090D规格性能全方面阉割不同,RTX 5090D仅仅是将AI算力从3352 TOPS降至2375 TOPS,其他规格没有任何缩减,这也意味着它游戏性能几乎完全等同于RTX 5090,从这里也能看出NVIDIA对于内地游戏市场的重视程度。
AD102核心
GB202核心
RTX 5090基于GB202核心,可以看出它与上代的AD102非常相似,都是12组GPC,每组GPC包含16个ROP,也就说GB202与AD102最多都是192个ROP单元。
二者主要区别在于,AD102的每组GPC包含6组TPC、12组SM单元、1536个流处理器。而GB202则是在每组GPC中增加了2组TPC,也就是每组GPC包含8组TPC、16组SM单元、2048个流处理器,刚好增加了1/3。
完整的GB202核心共有24576个CUDA核心(分为12组GPC/96组TPC/192组SM)、768个第5代Tensor Core张量核心、192个第4代RT Core光追核心、768个纹理单元、192个ROP单元、128MB二级缓存。
RTX 5090在基础上做了些许精简,拥有11组GPC共21760个流处理器、680个Tensor Core、170个RT Core和192个ROP单元,而128MB二级缓存则得到了完整的保留。
至于RTX 5090D,猜测应该是屏蔽掉了1/3的Tensor Core张量核心,其他参数不变。
RTX 5090D参数规格如下:
当然,仅仅只是规格增加1/3是远远不够的,Blackwell架构还带来了支持多帧生成(MFG)和Transformer模型的DLSS 4技术,512Bit的显存位宽和28Gbps GDDR7显存。
时间所限,对于Blackwell架构这里不做多说,有兴趣的同学可以参考这篇文章《Blackwell RTX 50架构深度揭秘:AI神经网络渲染、DLSS 4才是战未来!》。
七彩虹iGame RTX 5090D Advanced 32G GPU截图
由于RTX 5090D没有公版,此次首发测试我们使用的是七彩虹iGame RTX 5090D Advanced 32GB。
这块显卡支持一键超频,而在默认设置下,它的参数与NVIDIA官方标准完全相同:575W TDP、2407MHz加速频率、28Gbps显存速率。
二、七彩虹iGame RTX 5090D Advanced 32GB显卡图赏
iGame RTX 5090D Advanced 32GB采用全新的磨砂黑透外甲设计,能隐约看见扇热器内部构造。
显卡背面。
尾端采用环形开孔设计,可以将热风直接吹出来,不会在PCB上停留。
显卡顶部视角图,3.5槽厚度。
顶部中间是16Pin供电接口,旁边是RGB灯效接口。
尾部也做了全金属包裹处理,有公版的感觉。
1个HDMI 2.1和3个DP 2.1a接口,注意散热器高度远超过了I/O挡板。
旋涡散热器,大面积的均热板,7条8mm+2条6mm一共9条热管,使用回流焊工艺穿插在散热鳍片中。
由于正面空间不够,部分供电电容被放在了PCB板背面,并且使用高成本的钽电容。
GB202-250-A1核心,核心面积744mm2,922个晶体管。
三星GDDR7显存,单颗容量2GB,速率为28Gbps,一共有16颗。
三、测试平台:最强游戏处理器
测试平台如下:
此前我们的测试平台一直使用i9-14900KS,可惜Ultra 9 285K开了倒车,换上地表最强游戏处理器--锐龙9 9800X3D。
不出意外,未来很长一段时间,我们的首发评测都会使用锐龙9 9800X3D处理器。
技嘉X670E AORUS XTREME,支持XMP/EXPO高频宽,可以一键降低10%延迟,提升10%带宽。
长江存储TiPlus7100 SSD,基于晶栈3.0架构闪存,I/O速度高达2400MT/s,只需四通道就能达成7000MB/s的性能。
七彩虹CVN DDR5 6000 16GB x2套条,时序34-44-44-108,电压1.4V。
我们在测试时会调整为6200MHz CL30-38-38-96。
微星MAG CORELIQUID I360水冷散热器,冷头采用了独特的双面无限镜设计,风风扇的线材是积木链接设计的,支持一线连模式,不会像常规水冷需要繁杂的接线。
鑫谷昆仑九重KE-1300P白金牌数字电源,能做到电压/功率智能跟随,在极高负载下也不会出现普通电源那种掉压的情况。
本次测试还使用了鑫谷最新提供的12V-2x6 16针电源线,电流更加稳定。
技嘉M28U 4K显示器。
四、3DMark测试:最高运行频率2932MHz 比RTX 4090高了160MHz
1、3DMark Fire Strike
在2K分辨率3DMark Fire Strike Extreme测试中,iGame RTX 5090D Advanced图形分数达到了59168分,核心温度最高56.4℃,核心运行最高频率为2932MHz,最高风扇转速1370PM,整卡最高功耗540W。
可以看到RTX 5090D的最高频率比起RTX 4090的2775MHz高了160MHz,当然电压也高了0.05V左右。
另外,RTX 50系列GPU取消了Hot Spot热点温度传感器,GPU-Z显示的255度是一个错误的数字。
在4K分辨率3DMark Fire Strike Ultra测试中,RTX 5090D图形分数为32710分,核心温度最高60℃,核心运行最高频率为2932MHz,最高风扇转速1566RPM,最高功耗578W。
在测试过程中,RTX 5090D的运行频率可以长时间稳定在2840MHz。
对比RTX 4090提升大约32%,对比RTX 4090D则提升多达45%。
2、3DMark Time Spy
在2K分辨率3DMark Time Spy测试中,RTX 5090D图形分数达到了49115分,核心温度最高65℃,核心运行最高频率为2925MHz,最高功耗567W,最高风扇转速1799RPM。
在4K分辨率3DMark Time Spy Extreme测试中, RTX 5090D图形分数为25870,核心温度最高67℃,核心运行最高频率为2917MHz,最高功耗587W。
对比RTX 4090提升33%,对比RTX 4090D则提升45%。
五、1080P游戏性能测试:CPU存在巨大瓶颈
1、刺客信条:英灵殿
2、地平线:零之曙光
3、孤岛惊魂5
4、孤岛惊魂6
5、古墓丽影:暗影
6、黑神话:悟空
7、霍格沃茨之遗
8、极限竞速:地平线5
9、龙腾世纪:影障守护者
10、赛博朋克2077
11、巫师3
12、无主之地3
13、心灵杀手2
14、星空
15、星球大战:亡命之徒
16、战争机器5
测试数据汇总如下:
1080P分辨率下 ,由于CPU存在巨大的瓶颈,高端显卡之间完全无法拉开性能差距,RTX 5090D只比RTX 4090D快了16%,比RX 7900 XTX快了33%。
六、2K游戏性能测试:对比RTX 4090D提升25%
1、刺客信条:英灵殿
2、地平线:零之曙光
3、孤岛惊魂5
4、孤岛惊魂6
5、古墓丽影:暗影
6、黑神话:悟空
7、霍格沃茨之遗
8、极限竞速:地平线5
9、龙腾世纪:影障守护者
10、赛博朋克2077
11、巫师3
12、无主之地3
13、心灵杀手2
14、星空
15、星球大战:亡命之徒
16、战争机器5
测试数据汇总如下:
到了2K分辨率之后,情况好了一些,RTX 5090D比RTX 4090D要强了25%,比RX 7900 XTX则强了46%。
七、4K游戏性能测试:发挥真正实力 比4090D提升38%
1、刺客信条:英灵殿
2、地平线:零之曙光
3、孤岛惊魂5
4、孤岛惊魂6
5、古墓丽影:暗影
6、黑神话:悟空
7、霍格沃茨之遗
8、极限竞速:地平线5
9、龙腾世纪:影障守护者
10、赛博朋克2077
11、巫师3
12、无主之地3
13、心灵杀手2
14、星空
15、星球大战:亡命之徒
16、战争机器5
测试数据汇总如下:
到了4K分辨率,RTX 5090D才发挥出真正实力,比RTX 4090D强了38%,比RX 7900 XTX快了72%,比起RTX 3090 Ti,几乎强了100%。
八、DLSS 4游戏测试:平均4.5倍提升
Blackwell架构最大的变化就是带来了全新的DLSS 4多帧生成(MFG)技术, 基于强大的AI模型,可以通过AI生成帧画面,插入常规渲染帧之间, 而且只需运行一次,就能为每个传统渲染帧额外生成多达三个帧,再配合超分技术,可以带来800%的性能提升。
此次我们一共测试了5款支持DLSS 4的游戏:《星球大战:亡命之徒》、《心灵杀手2》、《赛博朋克2077》、《龙腾世纪:影障守护者》、《霍格沃茨之遗》。
所有DLSS 4以及光追测试都是在4K分辨率下进行。
1、星球大战:亡命之徒
4K分辨率最高画质下,RTX 5090D帧率为90FPS。
开启光追之后掉到了37FPS。
打开DLSS 4多重插帧之后,帧率暴涨到了270FPS,提升幅度高达630%。
2、心灵杀手2
4K分辨率下,《心灵杀手2》开启光追之后,RTX 5090D的帧率只剩32FPS。
开启DLSS 4之后,帧率来到了205FPS,提升幅度为540%。
3、赛博朋克2077
《赛博朋克2077》在4K分辨率下帧率为139FPS,开启光追之后掉到了55FPS,打开DLSS 4之后,帧率为372FPS,提升幅度576%。
4、龙腾世纪:影障守护者
《龙腾世纪:影障守护者》需要在NVIDIA app里面开启DLSS 4多重插帧。
4K分辨率最高画质,RTX 5090D的帧率是112FPS,开启光追之后帧率为83FPS,打开DLSS 4,帧率286FPS,提升幅度为245%。
5、霍格沃茨之遗
《霍格沃茨之遗》开启光追之后,RTX 5090D的帧率为96FPS,打开DLSS 4之后,帧率来到了369FPS,提升幅度284%。
从上表可以看到,RTX 5090D的光追效率与RTX 4090D几乎相同,打开之后帧率都下跌了48%,比RTX 3090 Ti要强不少。
但是DLSS 2的效率方面,RTX 5090D不如RTX 3090 Ti和RTX 4090D,前代打开DLSS 2之后,帧率提升幅度约为125%,RTX 4090D则是107%,提升幅度低了18%左右。可能是新卡对老技术优化不到位(毕竟不是重点),也可能是Tensor算力受到了限制。
但是在开启DLSS 4之后,RTX 5090D的表现可以说是一骑绝尘,多款游戏的提升幅度超过了500%,5个游戏平均下来,提升幅度也有455%,几乎是DLSS 3的2倍。
测试中都使用了游戏默认设置,DLSS 3开启帧生成,DLSS 4开启多帧生成,未使用路径光追。
九、AI测试:平均提升近40% 仍需大模型适配
1、AI Image Generation Benchmark--Stable Diffusion 1.5(FP16)
当RTX 5090D使用FP16精度进行AI Image Generation Benchmark测试时,总分为7918。
但是用FP4精度时,可以看到即便分辨率从512提升到1024,生图效率相比PF16时也没有降低太多。
目前除了RTX 5090D之外,其他显卡都不支持FP4。
2、AI Text Generation Benchmark--PHI 3.5
这里我们只对比PHI 3.5的性能,RTX 5090D比RTX 4090D强了30%左右,比AMD RX 7900 XTX强了167%。
测试数据汇总如下:
不考虑FP4精度,RTX 5090D的AI性能比RTX 4090D强了39%,比RTX 3090 Ti强了104%左右,对比RX 7900 XTX则强了220%。
不过,目前针对RTX 5090D的AI大模型、软件适配还不到位,很多都无法正常运行,真正的实力还有待挖掘。
十、生产力测试:高负载渲染可提升40%
1、PugetBench for Photoshop
2、PugetBench for Primiere Pro
3、PugetBench for DaVinci Resolve
4、Procyon视频编辑测试
5、Blender Benchmark
6、Indig Benchmark v4.4.15
7、Vray-Benchmark
测试数据汇总如下:
Adobe应用,RTX 5090D其实没有太大的优势,Photoshop的性能甚至还稍弱于其他几块显卡,当然差距也不是很大。
但是Blender、Vray这样的高负载渲染应用,RTX 5090D明显更强一些,比RTX 4090D强了40%左右,比起RX 7900 XTX则有3~4倍的性能优势。
十一、实际功耗测试:4K游戏平均达500W
1)、烤机测试
室温20度,使用Furmark烤机10分钟,GPU功耗稳定在574W,核心频率2437MHz,温度68度,风扇转速2095RPM。
看来即便是575W这样的超高功耗,RTX 5090D也能很好地应对。
2)、游戏功耗
目前微星Afterburner暂不支持RTX 5090D,我们使用FrameView来测试RTX 5090D的功耗。
1、GTAV
1080P分辨率下,RTX 5090D的功耗为163W,温度只有40度。
RTX 4090D的功耗为106W,温度则是52度(风扇停转)。
RTX 3090 Ti的功耗则高达226W,温度58度。
2K分辨率下,RTX 5090D功耗为197W,RTX 4090D是183W,RTX 3090 Ti则是292W。
到了4K分辨率,三张显卡的功耗分别为317W、314W、381W。
2、黑神话:悟空
1080P分辨率下,RTX 5090D的功耗为400W、RTX 4090D是331W,RTX 3090 Ti则是388W。
2K分辨率下,3款显卡的功耗分别为443W、331W、415W。
到了4K分辨率,3块显卡的功耗各为492W、379W、441W。
功耗表现最优秀的是RTX 4090D,RTX 5090D的能效比与RTX 4090D相当。
RTX 5090D在1080P、2K与4K分辨率下的游戏功耗分别为358W、427W、496W。1080P分辨率下的功耗甚至还略低于RTX 3090 Ti,2K分辨率时功耗比RTX 3090 Ti高了7%,4K分辨率下在高出14%左右。
考虑到4K分辨率下RTX 5090D的游戏性能差不多是RTX 3090 Ti的2倍,换算下来它的能效比也是后者的2倍左右。
十二、总结:十年来最高效GPU
本次我们一共测试了超过500个数据,长话短说,以下为测试小结:
1、性能
4K分辨率下,RTX 5090D比RTX 4090强了30%,也许很多同学并不太满意,但这个数字比我们想象的要好很多。
上代的RTX 4090拥有763亿晶体管,2.7倍于RTX 3090 Ti。运行频率高达2.7GHz,比前代也高了40%。也就是说,2.7倍的晶体管再加上额外的40%频率提升,才带来了50%的性能提升。
RTX 5090D的于制程工艺变化不大,晶体管也只比RTX 4090多了20%,频率提升不到10%,但是性能却是实打实地提升了30%,对比AMD最强的RX 7900 XTX领先幅度超过了70%。除了Blackwell,近十年来很少有GPU架构能够做到如此的高效。
毫无疑问,在“RTX 5090 Ti”出现之前,不会有任何桌面显卡对它构成威胁。
从RTX 5090D的性能提升幅度,也可以稍微畅想一下即将到来的RTX 5080,也许会有想象不到的惊喜!
2、功耗
两年前的RTX 4090是我们测试过的能效比最优秀显卡,450W的TDP,但实际游戏功耗只有200~300W,很少超过400W。
Blackwell采用的是台积电4NP工艺,和Ada Lovelace的4N比起来最大的变化就是改善了漏电率,可以上到更高频率,而在能效比方面,RTX 5090D与RTX 4090非常接近,二倍于RTX 3090 Ti。
我们测试了8款游戏的实际功耗,平均下来,在1080P分辨率下,RTX 5090D的功耗为358W,2K分辨率是427W,4K则接近500W。建议装机时,尽量选配1000瓦以上的单路电源。
3、DLSS 4和光追
为了能在内地正常销售,RTX 5090D砍掉了1/3的Tensor AI算力,这对于光栅性能没有什么影响,至于DLSS性能...
我们测试了5款游戏,在开启DLSS 2(不开插帧)时,RTX 5090D的平均提升幅度为107%,RTX 4090D和RTX 3090 Ti则有125%左右,也就是说砍掉的AI算力多少会到DLSS性能表现。
但在DLSS 4的加持下,这些都不是事。
在开启DLSS 4之后,RTX 5090D的表现可以说是一骑绝尘,多款游戏的提升幅度超过了500%,5个游戏平均下来,提升幅度也有455%,几乎是DLSS 3的2倍。
时至今日,相信也不会有多少玩家会再质疑DLSS的画质,那么白送的帧率提升为什么不要呢!
4、AI性能
在不考虑FP4的情况下,RTX 5090D的AI推力和生图性能分别是RX 7900 XTX的2.7倍和4倍。
而当使用FP4精度进行测试时,RTX 5090D可以在生图速度变化不大的情况下,将出图分辨率提升到原来的4倍。
相信随着今后越来越多的AI模型加入对Blackwell的支持,RTX 50 GPU将给我们来焕然一新的AI体验!
最后就是价格了!
RTX 5090D 16499元的售价面对的主要是发烧级土豪玩家,而真正的高端甜品,是即将到来的RTX 5080。
大年初一晚上,我们会给大家带来NVIDIA RTX 5080 Founders Edition首发评测,敬请期待!
来源:驱动之家