十年来最高效GPU!NVIDIA RTX 5090D首发评测:原生性能提升30% DLSS 4一骑绝尘

B站影视 2025-01-24 22:00 2

摘要:2025年1月23号,也就是昨天,NVIDIA RTX 5090正式解禁!只是这款显卡无法在内地销售,我们拿到的是RTX 5090D,这也导致了我们的首发评测比国外同行晚了一天!

一、前言:主要规格几乎一刀未砍的RTX 5090D

2025年1月23号,也就是昨天,NVIDIA RTX 5090正式解禁!只是这款显卡无法在内地销售,我们拿到的是RTX 5090D,这也导致了我们的首发评测比国外同行晚了一天!

但和RTX 4090D规格性能全方面阉割不同,RTX 5090D仅仅是将AI算力从3352 TOPS降至2375 TOPS,其他规格没有任何缩减,这也意味着它游戏性能几乎完全等同于RTX 5090,从这里也能看出NVIDIA对于内地游戏市场的重视程度。


AD102核心


GB202核心

RTX 5090基于GB202核心,可以看出它与上代的AD102非常相似,都是12组GPC,每组GPC包含16个ROP,也就说GB202与AD102最多都是192个ROP单元。

二者主要区别在于,AD102的每组GPC包含6组TPC、12组SM单元、1536个流处理器。而GB202则是在每组GPC中增加了2组TPC,也就是每组GPC包含8组TPC、16组SM单元、2048个流处理器,刚好增加了1/3。

完整的GB202核心共有24576个CUDA核心(分为12组GPC/96组TPC/192组SM)、768个第5代Tensor Core张量核心、192个第4代RT Core光追核心、768个纹理单元、192个ROP单元、128MB二级缓存。

RTX 5090在基础上做了些许精简,拥有11组GPC共21760个流处理器、680个Tensor Core、170个RT Core和192个ROP单元,而128MB二级缓存则得到了完整的保留。

至于RTX 5090D,猜测应该是屏蔽掉了1/3的Tensor Core张量核心,其他参数不变。

RTX 5090D参数规格如下:

当然,仅仅只是规格增加1/3是远远不够的,Blackwell架构还带来了支持多帧生成(MFG)和Transformer模型的DLSS 4技术,512Bit的显存位宽和28Gbps GDDR7显存。

时间所限,对于Blackwell架构这里不做多说,有兴趣的同学可以参考这篇文章《Blackwell RTX 50架构深度揭秘:AI神经网络渲染、DLSS 4才是战未来!》。

七彩虹iGame RTX 5090D Advanced 32G GPU截图

由于RTX 5090D没有公版,此次首发测试我们使用的是七彩虹iGame RTX 5090D Advanced 32GB。

这块显卡支持一键超频,而在默认设置下,它的参数与NVIDIA官方标准完全相同:575W TDP、2407MHz加速频率、28Gbps显存速率。

二、七彩虹iGame RTX 5090D Advanced 32GB显卡图赏

iGame RTX 5090D Advanced 32GB采用全新的磨砂黑透外甲设计,能隐约看见扇热器内部构造。

显卡背面。

尾端采用环形开孔设计,可以将热风直接吹出来,不会在PCB上停留。

显卡顶部视角图,3.5槽厚度。

顶部中间是16Pin供电接口,旁边是RGB灯效接口。

尾部也做了全金属包裹处理,有公版的感觉。

1个HDMI 2.1和3个DP 2.1a接口,注意散热器高度远超过了I/O挡板。

旋涡散热器,大面积的均热板,7条8mm+2条6mm一共9条热管,使用回流焊工艺穿插在散热鳍片中。

由于正面空间不够,部分供电电容被放在了PCB板背面,并且使用高成本的钽电容。

GB202-250-A1核心,核心面积744mm2,922个晶体管。

三星GDDR7显存,单颗容量2GB,速率为28Gbps,一共有16颗。

三、测试平台:最强游戏处理器

测试平台如下:

此前我们的测试平台一直使用i9-14900KS,可惜Ultra 9 285K开了倒车,换上地表最强游戏处理器--锐龙9 9800X3D。

不出意外,未来很长一段时间,我们的首发评测都会使用锐龙9 9800X3D处理器。

技嘉X670E AORUS XTREME,支持XMP/EXPO高频宽,可以一键降低10%延迟,提升10%带宽。

长江存储TiPlus7100 SSD,基于晶栈3.0架构闪存,I/O速度高达2400MT/s,只需四通道就能达成7000MB/s的性能。

七彩虹CVN DDR5 6000 16GB x2套条,时序34-44-44-108,电压1.4V。

我们在测试时会调整为6200MHz CL30-38-38-96。

微星MAG CORELIQUID I360水冷散热器,冷头采用了独特的双面无限镜设计,风风扇的线材是积木链接设计的,支持一线连模式,不会像常规水冷需要繁杂的接线。

鑫谷昆仑九重KE-1300P白金牌数字电源,能做到电压/功率智能跟随,在极高负载下也不会出现普通电源那种掉压的情况。

本次测试还使用了鑫谷最新提供的12V-2x6 16针电源线,电流更加稳定。

技嘉M28U 4K显示器。

四、3DMark测试:最高运行频率2932MHz 比RTX 4090高了160MHz

1、3DMark Fire Strike

在2K分辨率3DMark Fire Strike Extreme测试中,iGame RTX 5090D Advanced图形分数达到了59168分,核心温度最高56.4℃,核心运行最高频率为2932MHz,最高风扇转速1370PM,整卡最高功耗540W。

可以看到RTX 5090D的最高频率比起RTX 4090的2775MHz高了160MHz,当然电压也高了0.05V左右。

另外,RTX 50系列GPU取消了Hot Spot热点温度传感器,GPU-Z显示的255度是一个错误的数字。

在4K分辨率3DMark Fire Strike Ultra测试中,RTX 5090D图形分数为32710分,核心温度最高60℃,核心运行最高频率为2932MHz,最高风扇转速1566RPM,最高功耗578W。

在测试过程中,RTX 5090D的运行频率可以长时间稳定在2840MHz。

对比RTX 4090提升大约32%,对比RTX 4090D则提升多达45%。

2、3DMark Time Spy

在2K分辨率3DMark Time Spy测试中,RTX 5090D图形分数达到了49115分,核心温度最高65℃,核心运行最高频率为2925MHz,最高功耗567W,最高风扇转速1799RPM。

在4K分辨率3DMark Time Spy Extreme测试中, RTX 5090D图形分数为25870,核心温度最高67℃,核心运行最高频率为2917MHz,最高功耗587W。

对比RTX 4090提升33%,对比RTX 4090D则提升45%。

五、1080P游戏性能测试:CPU存在巨大瓶颈

1、刺客信条:英灵殿

2、地平线:零之曙光

3、孤岛惊魂5

4、孤岛惊魂6

5、古墓丽影:暗影

6、黑神话:悟空

7、霍格沃茨之遗

8、极限竞速:地平线5

9、龙腾世纪:影障守护者

10、赛博朋克2077

11、巫师3

12、无主之地3

13、心灵杀手2

14、星空

15、星球大战:亡命之徒

16、战争机器5

测试数据汇总如下:

1080P分辨率下 ,由于CPU存在巨大的瓶颈,高端显卡之间完全无法拉开性能差距,RTX 5090D只比RTX 4090D快了16%,比RX 7900 XTX快了33%。

六、2K游戏性能测试:对比RTX 4090D提升25%

1、刺客信条:英灵殿

2、地平线:零之曙光

3、孤岛惊魂5

4、孤岛惊魂6

5、古墓丽影:暗影

6、黑神话:悟空

7、霍格沃茨之遗

8、极限竞速:地平线5

9、龙腾世纪:影障守护者

10、赛博朋克2077

11、巫师3

12、无主之地3

13、心灵杀手2

14、星空

15、星球大战:亡命之徒

16、战争机器5

测试数据汇总如下:

到了2K分辨率之后,情况好了一些,RTX 5090D比RTX 4090D要强了25%,比RX 7900 XTX则强了46%。

七、4K游戏性能测试:发挥真正实力 比4090D提升38%

1、刺客信条:英灵殿

2、地平线:零之曙光

3、孤岛惊魂5

4、孤岛惊魂6

5、古墓丽影:暗影

6、黑神话:悟空

7、霍格沃茨之遗

8、极限竞速:地平线5

9、龙腾世纪:影障守护者

10、赛博朋克2077

11、巫师3

12、无主之地3

13、心灵杀手2

14、星空

15、星球大战:亡命之徒

16、战争机器5

测试数据汇总如下:

到了4K分辨率,RTX 5090D才发挥出真正实力,比RTX 4090D强了38%,比RX 7900 XTX快了72%,比起RTX 3090 Ti,几乎强了100%。

八、DLSS 4游戏测试:平均4.5倍提升

Blackwell架构最大的变化就是带来了全新的DLSS 4多帧生成(MFG)技术, 基于强大的AI模型,可以通过AI生成帧画面,插入常规渲染帧之间, 而且只需运行一次,就能为每个传统渲染帧额外生成多达三个帧,再配合超分技术,可以带来800%的性能提升。

此次我们一共测试了5款支持DLSS 4的游戏:《星球大战:亡命之徒》、《心灵杀手2》、《赛博朋克2077》、《龙腾世纪:影障守护者》、《霍格沃茨之遗》。

所有DLSS 4以及光追测试都是在4K分辨率下进行。

1、星球大战:亡命之徒

4K分辨率最高画质下,RTX 5090D帧率为90FPS。

开启光追之后掉到了37FPS。

打开DLSS 4多重插帧之后,帧率暴涨到了270FPS,提升幅度高达630%。

2、心灵杀手2

4K分辨率下,《心灵杀手2》开启光追之后,RTX 5090D的帧率只剩32FPS。

开启DLSS 4之后,帧率来到了205FPS,提升幅度为540%。

3、赛博朋克2077

《赛博朋克2077》在4K分辨率下帧率为139FPS,开启光追之后掉到了55FPS,打开DLSS 4之后,帧率为372FPS,提升幅度576%。

4、龙腾世纪:影障守护者

《龙腾世纪:影障守护者》需要在NVIDIA app里面开启DLSS 4多重插帧。

4K分辨率最高画质,RTX 5090D的帧率是112FPS,开启光追之后帧率为83FPS,打开DLSS 4,帧率286FPS,提升幅度为245%。

5、霍格沃茨之遗

《霍格沃茨之遗》开启光追之后,RTX 5090D的帧率为96FPS,打开DLSS 4之后,帧率来到了369FPS,提升幅度284%。

从上表可以看到,RTX 5090D的光追效率与RTX 4090D几乎相同,打开之后帧率都下跌了48%,比RTX 3090 Ti要强不少。

但是DLSS 2的效率方面,RTX 5090D不如RTX 3090 Ti和RTX 4090D,前代打开DLSS 2之后,帧率提升幅度约为125%,RTX 4090D则是107%,提升幅度低了18%左右。可能是新卡对老技术优化不到位(毕竟不是重点),也可能是Tensor算力受到了限制。

但是在开启DLSS 4之后,RTX 5090D的表现可以说是一骑绝尘,多款游戏的提升幅度超过了500%,5个游戏平均下来,提升幅度也有455%,几乎是DLSS 3的2倍。

测试中都使用了游戏默认设置,DLSS 3开启帧生成,DLSS 4开启多帧生成,未使用路径光追。

九、AI测试:平均提升近40% 仍需大模型适配

1、AI Image Generation Benchmark--Stable Diffusion 1.5(FP16)

当RTX 5090D使用FP16精度进行AI Image Generation Benchmark测试时,总分为7918。

但是用FP4精度时,可以看到即便分辨率从512提升到1024,生图效率相比PF16时也没有降低太多。

目前除了RTX 5090D之外,其他显卡都不支持FP4。

2、AI Text Generation Benchmark--PHI 3.5

这里我们只对比PHI 3.5的性能,RTX 5090D比RTX 4090D强了30%左右,比AMD RX 7900 XTX强了167%。

测试数据汇总如下:

不考虑FP4精度,RTX 5090D的AI性能比RTX 4090D强了39%,比RTX 3090 Ti强了104%左右,对比RX 7900 XTX则强了220%。

不过,目前针对RTX 5090D的AI大模型、软件适配还不到位,很多都无法正常运行,真正的实力还有待挖掘。

十、生产力测试:高负载渲染可提升40%

1、PugetBench for Photoshop

2、PugetBench for Primiere Pro

3、PugetBench for DaVinci Resolve

4、Procyon视频编辑测试

5、Blender Benchmark

6、Indig Benchmark v4.4.15

7、Vray-Benchmark

测试数据汇总如下:

Adobe应用,RTX 5090D其实没有太大的优势,Photoshop的性能甚至还稍弱于其他几块显卡,当然差距也不是很大。

但是Blender、Vray这样的高负载渲染应用,RTX 5090D明显更强一些,比RTX 4090D强了40%左右,比起RX 7900 XTX则有3~4倍的性能优势。

十一、实际功耗测试:4K游戏平均达500W

1)、烤机测试

室温20度,使用Furmark烤机10分钟,GPU功耗稳定在574W,核心频率2437MHz,温度68度,风扇转速2095RPM。

看来即便是575W这样的超高功耗,RTX 5090D也能很好地应对。

2)、游戏功耗

目前微星Afterburner暂不支持RTX 5090D,我们使用FrameView来测试RTX 5090D的功耗。

1、GTAV

1080P分辨率下,RTX 5090D的功耗为163W,温度只有40度。

RTX 4090D的功耗为106W,温度则是52度(风扇停转)。

RTX 3090 Ti的功耗则高达226W,温度58度。

2K分辨率下,RTX 5090D功耗为197W,RTX 4090D是183W,RTX 3090 Ti则是292W。

到了4K分辨率,三张显卡的功耗分别为317W、314W、381W。

2、黑神话:悟空

1080P分辨率下,RTX 5090D的功耗为400W、RTX 4090D是331W,RTX 3090 Ti则是388W。

2K分辨率下,3款显卡的功耗分别为443W、331W、415W。

到了4K分辨率,3块显卡的功耗各为492W、379W、441W。

功耗表现最优秀的是RTX 4090D,RTX 5090D的能效比与RTX 4090D相当。

RTX 5090D在1080P、2K与4K分辨率下的游戏功耗分别为358W、427W、496W。1080P分辨率下的功耗甚至还略低于RTX 3090 Ti,2K分辨率时功耗比RTX 3090 Ti高了7%,4K分辨率下在高出14%左右。

考虑到4K分辨率下RTX 5090D的游戏性能差不多是RTX 3090 Ti的2倍,换算下来它的能效比也是后者的2倍左右。

十二、总结:十年来最高效GPU

本次我们一共测试了超过500个数据,长话短说,以下为测试小结:

1、性能

4K分辨率下,RTX 5090D比RTX 4090强了30%,也许很多同学并不太满意,但这个数字比我们想象的要好很多。

上代的RTX 4090拥有763亿晶体管,2.7倍于RTX 3090 Ti。运行频率高达2.7GHz,比前代也高了40%。也就是说,2.7倍的晶体管再加上额外的40%频率提升,才带来了50%的性能提升。

RTX 5090D的于制程工艺变化不大,晶体管也只比RTX 4090多了20%,频率提升不到10%,但是性能却是实打实地提升了30%,对比AMD最强的RX 7900 XTX领先幅度超过了70%。除了Blackwell,近十年来很少有GPU架构能够做到如此的高效。

毫无疑问,在“RTX 5090 Ti”出现之前,不会有任何桌面显卡对它构成威胁。

从RTX 5090D的性能提升幅度,也可以稍微畅想一下即将到来的RTX 5080,也许会有想象不到的惊喜!

2、功耗

两年前的RTX 4090是我们测试过的能效比最优秀显卡,450W的TDP,但实际游戏功耗只有200~300W,很少超过400W。

Blackwell采用的是台积电4NP工艺,和Ada Lovelace的4N比起来最大的变化就是改善了漏电率,可以上到更高频率,而在能效比方面,RTX 5090D与RTX 4090非常接近,二倍于RTX 3090 Ti。

我们测试了8款游戏的实际功耗,平均下来,在1080P分辨率下,RTX 5090D的功耗为358W,2K分辨率是427W,4K则接近500W。建议装机时,尽量选配1000瓦以上的单路电源。

3、DLSS 4和光追

为了能在内地正常销售,RTX 5090D砍掉了1/3的Tensor AI算力,这对于光栅性能没有什么影响,至于DLSS性能...

我们测试了5款游戏,在开启DLSS 2(不开插帧)时,RTX 5090D的平均提升幅度为107%,RTX 4090D和RTX 3090 Ti则有125%左右,也就是说砍掉的AI算力多少会到DLSS性能表现。

但在DLSS 4的加持下,这些都不是事。

在开启DLSS 4之后,RTX 5090D的表现可以说是一骑绝尘,多款游戏的提升幅度超过了500%,5个游戏平均下来,提升幅度也有455%,几乎是DLSS 3的2倍。

时至今日,相信也不会有多少玩家会再质疑DLSS的画质,那么白送的帧率提升为什么不要呢!

4、AI性能

在不考虑FP4的情况下,RTX 5090D的AI推力和生图性能分别是RX 7900 XTX的2.7倍和4倍。

而当使用FP4精度进行测试时,RTX 5090D可以在生图速度变化不大的情况下,将出图分辨率提升到原来的4倍。

相信随着今后越来越多的AI模型加入对Blackwell的支持,RTX 50 GPU将给我们来焕然一新的AI体验!

最后就是价格了!

RTX 5090D 16499元的售价面对的主要是发烧级土豪玩家,而真正的高端甜品,是即将到来的RTX 5080。

大年初一晚上,我们会给大家带来NVIDIA RTX 5080 Founders Edition首发评测,敬请期待!

来源:驱动之家

相关推荐