RTX 5080 FE首发评测:功耗低于RTX 4080、性能接近RTX 4090D

B站影视 2025-02-06 16:42 3

摘要:仅凭增加30%的规格就提升了30%的性能,RTX 5090D可以说是十年来最高效GPU。要知道上代的RTX 4090在2.7倍的晶体管数量、1.4倍频率运行频率双加持下,相比RTX 3090 Ti才提升了50%的性能!

一、前言:颠覆你对Blackwell GPU高功耗的既有印象

仅凭增加30%的规格就提升了30%的性能,RTX 5090D可以说是十年来最高效GPU。要知道上代的RTX 4090在2.7倍的晶体管数量、1.4倍频率运行频率双加持下,相比RTX 3090 Ti才提升了50%的性能!

虽然性能无可挑剔,但它的功耗却比我们预期的要高了不少,而今天解禁的RTX 5080将会颠覆你对Blackwell GPU高功耗的既有印象!

RTX 5080采用NVIDIA定制的台积电4NP制程工艺,全新的Blackwell GPU架构,核心编号BG203。

与上代RTX 4080屏蔽了2组TPC单元不同,RTX 5080采用了完全的、没有任何精简的BG203-400核心。

GB203-400架构示意图

从上面的架构示意图可以看出,GB203与AD103的区别貌似就是补全了最后一个GPC,从4组TPC增加到完整到了6组TPC。

GB203由7个GPC组成,每个PGC包含6组TPC,再细分为12组SM单元,而每一组SM 还是有128个CUDA核心。

总计就是42组TPC、84组SM单元、10752个CUDA核心(流处理器),另外还有336个第5代Tensor Core张量核心、84个第4代RT Core光追核心、336个纹理单元、112个ROP单元、10.5MB一级缓存和64MB二级缓存。

令人惊讶的是,GB203与AD103核心面积均为378平方毫米,晶体管数量却从459亿减到了456亿,然而CUDA核心数量反而还增加了512个。

难道是NVIDIA能够更高效地利用每一个晶体管了?还是有其他原因?暂时不得而知。

RTX 5080详细规格参数如下:

比较有意思的是,除了缓存之外,RTX 5080的主要规格参数与RTX 3090 Ti几乎完全相同,而晶体管数量和芯片面积又与RTX 4080差不多。

而大的改进就是它采用了GDDR7显存,并且频率来到了前所未有的30GHz,再配合256Bit位宽,总带宽达到了960GB/s,相比RTX 4080提升了34%,非常接近RTX 3090 Ti的1008GB/s。

二、NVIDIA RTX 5080 Founders Edition图赏:迷你的方形PCB

不同于以往的包装盒,更环保。

开箱。

延续了RTX 5090 Founders Edition的外形设计, 相比RTX 40系列FE,边角要更加圆润平滑。

NVIDIA的攻城狮改进了散热设计,2个风扇都可以直接吹透显卡,可以大幅度提升散热效率。

背面。

3个支持UHBR20的DP 2.1b接口和一个HDMI 2.1b接口。

所有的视频接口都支持DSC压缩,而3个DP 2.1b接口可以输出4K 480Hz的12Bit HDR画面,或者8K 165Hz的12Bit HDR画面。

顶部的16Pin供电接口,倾斜设计,更有利于保护电源线。

散热器为对称设计,中间是纯铜底座,搭配5条8mm热管将热量传导至散热器两侧。

非常迷你的正方形PCB板,刚好位于散热器中间部位,不会挡住两侧的气流。

16+3相供电电路设计,满足360W的功率输出没什么问题。

由于正面空间不够,供电电容被放在了PCB板背面,并且全部使用的是高成本的钽电容。

与iPhone 15 Pro对比大小。

RTX 5080采用的是满血的GB203-400-A1核心,芯片面积378mm2,拥有456亿晶体管。

GPU旁边是8颗三星GDDR7显存,单颗2GB,总容量16GB,等效频率30GHz,带宽960GB/s。

附赠的3x8pin转16Pin线。

三、测试平台:锐龙7 9800X3D + 鑫谷昆仑九重KE-1300P白金牌数字电源

测试平台如下:

此前我们的测试平台一直使用i9-14900KS,可惜Ultra 9 285K开了倒车,换上地表最强游戏处理器--锐龙9 9800X3D。

不出意外,未来很长一段时间,我们的首发评测都会使用锐龙9 9800X3D处理器。

技嘉X670E AORUS XTREME,支持XMP/EXPO高频宽,可以一键降低10%延迟,提升10%带宽。

长江存储TiPlus7100 SSD,基于晶栈3.0架构闪存,I/O速度高达2400MT/s,只需四通道就能达成7000MB/s的性能。

七彩虹CVN DDR5 6000 16GB x2套条,时序34-44-44-108,电压1.4V。

我们在测试时会调整为6200MHz CL30-38-38-96。

微星MAG CORELIQUID I360水冷散热器,冷头采用了独特的双面无限镜设计,风风扇的线材是积木链接设计的,支持一线连模式,不会像常规水冷需要繁杂的接线。

鑫谷昆仑九重KE-1300P白金牌数字电源,能做到电压/功率智能跟随,在极高负载下也不会出现普通电源那种掉压的情况。

本次测试还使用了鑫谷最新提供的12V-2x6 16针电源线,电流更加稳定。

技嘉M28U 4K显示器。

四、3DMark测试:稳定频率只有2700MHz 比RTX 5090D低140MHz

1、3DMark Fire Strike

2K分辨率3DMark Fire Strike Extreme测试中,RTX 5080图形分数达到了38979分,核心温度最高59.4℃,核心运行最高频率为2775MHz,最高风扇转速1348PM,整卡最高功耗306W。

在4K分辨率3DMark Fire Strike Ultra测试中,RTX 5080图形分数为20655分,核心温度最高57.6℃,核心运行最高频率为2775MHz,最高风扇转速1302RPM,最高功耗331W。

2、3DMark Time Spy

在2K分辨率3DMark Time Spy测试中,RTX 5080图形分数达到了31563分,核心温度最高59.6℃,核心运行最高频率为2760MHz,最高功耗304W,最高风扇转速1320RPM。

在4K分辨率3DMark Time Spy Extreme测试中, RTX 5080图形分数为15855,核心温度最高62℃,核心运行最高频率为2767MHz,最高功耗333W。

在测试过程中,RTX 5080的运行频率可以长时间稳定在2700MHz,这个频率甚至比RTX 5090D还要低140MHz。

五、1080P分辨率测试:和RTX 4090D差距不大

1、刺客信条:英灵殿

2、地平线:零之曙光

3、孤岛惊魂5

4、孤岛惊魂6

5、古墓丽影:暗影

6、黑神话:悟空

7、霍格沃茨之遗

8、极限竞速:地平线5

9、龙腾世纪:影障守护者

10、赛博朋克2077

11、巫师3

12、无主之地3

13、心灵杀手2

14、星空

15、星球大战:亡命之徒

16、战争机器5

测试数据汇总如下:

1080p分辨率下,RTX 5080 FE对比上代RTX 4080平均提升了7%,而面对竞品旗舰RX 7900 XTX,仍然有10%的明显优势。

六、2K分辨率测试:比RX 7900 XTX强10%

1、刺客信条:英灵殿

2、地平线:零之曙光

3、孤岛惊魂5

4、孤岛惊魂6

5、古墓丽影:暗影

6、黑神话:悟空

7、霍格沃茨之遗

8、极限竞速:地平线5

9、龙腾世纪:影障守护者

10、赛博朋克2077

11、巫师3

12、无主之地3

13、心灵杀手2

14、星空

15、星球大战:亡命之徒

16、战争机器5

测试数据汇总如下:

到了2K分辨率,RTX 5080的优势得以扩大,对比RTX 4080平均提升了几乎10%,而在RX 7900 XTX的面前,依然有超过10%的优势。

七、4K分辨率测试:最适合的战场 提升几乎15%

1、刺客信条:英灵殿

2、地平线:零之曙光

3、孤岛惊魂5

4、孤岛惊魂6

5、古墓丽影:暗影

6、黑神话:悟空

7、霍格沃茨之遗

8、极限竞速:地平线5

9、龙腾世纪:影障守护者

10、赛博朋克2077

11、巫师3

12、无主之地3

13、心灵杀手2

14、星空

15、星球大战:亡命之徒

16、战争机器5

测试数据汇总如下:

很显然,4K分辨率才是RTX 5080的最佳战场,对比上代提升了几乎15%,同时领先竞品旗舰超过14%。

八、DLSS 4游戏测试:效率高于RTX 5090D

此次我们一共测试了5款支持DLSS 4的游戏:《星球大战:亡命之徒》、《心灵杀手2》、《赛博朋克2077》、《龙腾世纪:影障守护者》、《霍格沃茨之遗》。

所有DLSS 4以及光追测试都是在4K分辨率下进行。

1、星球大战:亡命之徒

4K分辨率最高画质下,RTX 5080帧率为54FPS。

开启光追之后掉到了21FPS。

打开DLSS 4多帧生成之后,帧率暴涨到了164FPS,提升了681%。

2、心灵杀手2

4K分辨率最高画质下,RTX 5080帧率为54FPS。

开启光追之后掉到了19FPS。

打开DLSS 4多帧生成之后,帧率暴涨到了122FPS,提升了540%。

3、赛博朋克2077

《赛博朋克2077》在4K分辨率下帧率为86FPS,开启光追之后掉到了31FPS,打开DLSS 4之后,帧率为245FPS,提升幅度690%。

4、龙腾世纪:影障守护者

《龙腾世纪:影障守护者》需要在NVIDIA app里面开启DLSS 4多帧生成。

4K分辨率最高画质,RTX 5080的帧率是75FPS,开启光追之后帧率为53FPS,打开DLSS 4,帧率257FPS,提升幅度为385%。

5、霍格沃茨之遗

4K分辨率最高画质,RTX 5080的帧率是91FPS,开启光追之后帧率为60FPS,打开DLSS 4,帧率306FPS,提升幅度为410%。

测试数据汇总如下:

可以看到RTX 5080的光追效率与RTX 4080几乎一样,开启帧率都下降了51%,略强于RTX 3090 Ti的-53%。

由于不像RTX 5090D那样阉割了部分1/3的AI算力,RTX 5080的DLSS 2效率比前者要强了30%左右。

在帧率方面,RTX 4080开启DLSS 3帧生成之后,性能提升幅度为271%;而RTX 5080开启DLSS 4多帧生成之后,提升幅度为542%,刚好是RTX 4080的二倍。

另外在DLSS 4的加持下,RTX 5080的帧率要远高于RTX 4090D,领先幅度约为50%。

测试中都使用了游戏默认设置,DLSS 3开启帧生成,DLSS 4开启多帧生成,未使用路径光追。

九、AI测试:比RTX 4080强20%左右

1、AI Image Generation Benchmark--Stable Diffusion 1.5(FP16)

当RTX 5080使用FP16精度进行AI Image Generation Benchmark测试时,总分为4669。

2、AI Text Generation Benchmark--PHI 3.5

这里我们只对比PHI 3.5的性能,RTX 5080比RTX 4080强了20%左右,比AMD RX 7900 XTX强了80%。

测试数据汇总如下:

不考虑FP4精度,RTX 5080D的AI性能比RTX 4080强了21%,比RTX 3090 Ti强了30%左右,对比RX 7900 XTX则强了103%。

十、生产力测试:略强于前代

1、PugetBench for Photoshop

2、PugetBench for Premiere Pro

3、PugetBench for DaVinci Resolve

4、Procyon视频编辑测试

5、Blender Benchmark v4.3

Blender v4.3是一款备受3D艺术家喜爱的开源3D建模和渲染软件,可以处理从建模、绑定、动画、模拟、渲染、合成和运动跟踪,甚至视频编辑和游戏创建的所有内容。

6、Indig Benchmark v4.4.15

Indigo Renderer是一款功能强大的图像渲染软件,被广泛应用于工业设计和建筑设计软件之上。

IndigoBench 基于 Indigo 4 的高级渲染引擎,测试程序支持GPU和CPU两种渲染模式。

7、Vray-Benchmark

V-Ray是一个广泛应用于建筑、工业设计和电影视觉效果领域的渲染软件,而V-RayBenchmark则是基于V-Ray渲染引擎的一款性能测试工具,主要用于评估系统在进行V-Ray+渲染时的性能,能准确反映系统在处理复杂3D场景渲染时的性能表现。

测试数据汇总如下:

十一、实际游戏功耗测试:竟比RTX 4080还低

RTX 5090D的功耗表现多少有点让我们失望,希望RTX 5080能带来惊喜!

1)、烤机测试

使用Furmark来对RTX 5080进行烤机测试,测试是室温为28度。

将Furmark的参数设定为1920*1200分辨率、0AA。

运行10分钟之后,RTX 5080的温度稳定在68度附近,显卡的功耗360W,烤机时GPU频率为2340MHz,CPU风扇转速只有1526RPM。

2)、游戏功耗

我们测试了8款游戏的实际功耗表现,受限于时间与篇幅,我们只展示2款游戏的详细功耗对比。

1、黑神话:悟空

1080P分辨率下,

RTX 5080功耗239W,帧率79FPS,每瓦特帧率0.33。

RTX 4080功耗270W,帧率74PS,每瓦特帧率0.27。

RTX 3090 Ti功耗388W,帧率56FPS,每瓦特帧率0.14。

RTX 5080的能效比是RTX 3090 Ti的2.4倍。

2K分辨率下,

RTX 5080功耗255W,帧率65FPS,每瓦特帧率0.25。

RTX 4080功耗287W,帧率58FPS,每瓦特帧率0.20。

RTX 3090 Ti功耗417W,帧率46FPS,每瓦特帧率0.11。

RTX 5080的能效比是RTX 3090 Ti的2.3倍。

4K分辨率下,

RTX 5080功耗277W,帧率41FPS,每瓦特帧率0.15。

RTX 4080功耗300W,帧率37FPS,每瓦特帧率0.12。

RTX 3090 Ti功耗441W,帧率31FPS,每瓦特帧率0.70。

RTX 5080的能效比是RTX 3090 Ti的2.1倍。

2、赛博朋克2077

1080P分辨率下,

RTX 5080功耗206W,帧率232FPS,每瓦特帧率1.13。

RTX 4080功耗273W,帧率214FPS,每瓦特帧率0.78。

RTX 3090 Ti功耗378W,帧率180FPS,每瓦特帧率0.47。

RTX 5080的能效比是RTX 3090 Ti的2.4倍。

2K分辨率下,

RTX 5080功耗240W,帧率172FPS,每瓦特帧率0.72。

RTX 4080功耗290W,帧率140FPS,每瓦特帧率0.48。

RTX 3090 Ti功耗426W,帧率131FPS,每瓦特帧率0.31。

RTX 5080的能效比是RTX 3090 Ti的2.3倍。

4K分辨率下,

RTX 5080功耗287W,帧率95FPS,每瓦特帧率0.33。

RTX 4080功耗309W,帧率69FPS,每瓦特帧率0.22。

RTX 3090 Ti功耗450W,帧率68FPS,每瓦特帧率0.15。

RTX 5080的能效比是RTX 3090 Ti的2.2倍。

点击大图,可以看到RTX 5080的频率为2677MHz、RTX 4080则是2745MHz,改进了直冲工艺,反而还降低了运行频率,这就是为什么RTX 5080的功耗比RTX 4080更低的原因所在。

测试数据汇总如下:

RTX 5080在1080P、2K与4K分辨率下的游戏功耗分别为219W、249W、286W,这三个数字全部都是所测试显卡中的最小数值。

在主流3A大作中,RTX 5080的能效比约为RTX 4080的1.2倍,RTX 3090 Ti的2.2~2.4倍。

十二、小结:功耗比RTX 4080更低 性能接近RTX 4090D

长话短说,以下是本次测试小结!

1、功耗

老实说,我们对RTX 5090D的能效比不甚满意,这块RTX 5080在这方面的优异表现实在让我们惊叹不已!

从上面这种图就可以看出RTX 5080的实力。

功耗比RTX 4080低50W、比RTX 3090 Ti低了近200W,但游戏帧率却高了不少。

我们一共测试了8款游戏的功耗,不论是1080P、2K还是4K分辨率,RTX 5080的功耗都是最低的。

顶着360W的TGP(功耗墙),4K分辨率下,游戏平均功耗仅为286W,实际游戏功耗也基本上不会超过300W,这与RTX 5090D动辄500W比起来,简直是云泥之别。

P.s.如果有同学不理解为什么RTX 5080会有这么优秀的能效比,可以点击大图,你就会注意到它的运行频率与电压比要比RTX 4080低不少,不要忘了还有增强版的台积电4NP制程工艺的加持。

2、性能

RTX 5080的已经全面超越了AMD上代旗舰RX 7900 XTX,在1080P、2K和4K分辨率下分别强了10%、10.3%和14%,比起RTX 4080,在4K分辨率下则有15%的性能优势!

和RTX 4090D的差距也不是很大,3个分辨率下的性能差距都没有超过10%。

3、DLSS 4和光追

和RTX 5090D相比,RTX 5080拥有更好的DLSS效率!

我们测试了5款支持DLSS 4的游戏,当只开启DLSS 2时,游戏帧率提升幅度为134%,RTX 5090则是107%。

打开DLSS 4,游戏帧率提升幅度达到了542%,《赛博朋克2077》和《星球大战:亡命之徒》这2款游戏的提升幅度更是接近700%。

相比之下,只支持DLSS 2的RTX 3090 Ti在开启DLSS之后性能提升幅度为124%,支持DLSS 3插帧的RTX 4080提升幅度则是299%。

4、价格

在30Gbps的GDDR7显存的加入自后,RTX 5080的制造成本应该是高于RTX 4080的,但却依然维持了与后者相同的8299元起售价。

更低的功耗,15%的性能提升,效率更高的散热系统,RTX 5080会火吗?

来源:驱动之家

相关推荐