摘要:英伟达在CES2025发布了RTX5090后,大家就十分期待,毕竟Blackwell拥有21760个 CUDA,虽然还是4nm工艺,但全新架构带来的AI性能提升应该是很明显的,毕竟现在新的3A大作很多都可以通过AI帧生成来保证流畅性,而且AI的应用领域非常广阔
英伟达在CES2025发布了RTX5090后,大家就十分期待,毕竟Blackwell拥有21760个 CUDA,虽然还是4nm工艺,但全新架构带来的AI性能提升应该是很明显的,毕竟现在新的3A大作很多都可以通过AI帧生成来保证流畅性,而且AI的应用领域非常广阔,从渲染到出图在对多模态对话模型,生产力方面也有大量的AI应用,RTX5090作为50系列最顶级且最具“性价比”最值得买的卡王。不过由于受到限制,中国大陆的供货仍然是5090D,在AI方面会有一些限制,好消息是核心是一样的,或许能通过类似4090D的超频或华强北的LHR解锁来突破限制,或者你也可以到海外买5090。我们拿到的是映众RTX 5090D曜夜X3,今天我们就来为大家揭晓5090D的性能,各位回头再对一下海外RTX5090的测试数据,就能大概了解差距了。
映众RTX5090D曜夜X3
我们先来介绍一下本次首发的映众的RTX5090D曜夜X3,尺寸为335*138*59mm,显卡占位为三槽设计,显卡优雅的灰黑配色加上纯白Logo灯的设计,适合不喜欢光污染的朋友。显卡正面搭配三个直径9.8cm的大尺寸9叶环形轴流风扇,支持风扇正逆转和自启停技术,在50°以下,风扇将停止旋转保持安静。
金刚臂隐藏式支撑架保证了显卡的稳定性,映众GeForce RTX 5090 D曜夜X3还搭配了九根六毫米的纯铜复合热管,显卡核心则是由VC均热板所包围。显卡热量将由VC均热板和热管进行快速转移,在三风扇九热管以及VC均热板的HZ X3散热系统强大散热加持下,不论是高分辨率游戏还是AI模型运行,都能保证为玩家及创作者输出顶级效能。
拆开显卡,我们可以看到GPU的核心。代号GB202的5090基于全新的Blackwell架构,D则为GB202-250,同样拥有21760个 CUDA(GB202实际有24576个CUDA,可能为TI准备),32GB GDDR7显存,显存位宽512bit,TDP功耗575w。
虽然还是4nm工艺,但全新架构带来的AI性能提升应该是很明显的,毕竟现在新的3A大作很多都可以通过AI帧生成来保证流畅性,DLSS4的4X模式1帧生3帧带来巨大的性能提升,而且AI的应用领域非常广阔,从渲染到出图在对多模态对话模型,生产力方面也有大量的AI应用,RTX5090作为50系列最顶级且最具“性价比”最值得买的卡王。
AI相关分析:
AI方面,Tensor AI算力5090为3352TOPS,而5090D只有2375TOPS,对比4090则为1321 TOPS,要知道在50系列的Blackwell架构下,所有的CUDA核心都可以处理FP或INT数据,这和原来40系的Ampere架构中有一半CUDA核心只能算FP32有着很大的区别。
我们也通过NV不同的官网整理了一个完整的规格参数表,可以看到在老黄出神入化的刀法下,虽然5070 TI的AI TOPS算力比4090都高,但是16GB的显存实在做不到太多事情。不过5090D还是很值得期待的,毕竟其 AI TOPS 大幅超越4090,或许4090的限制已经没有必要了。
另外,我们也整理了英伟达不同官网中给出的性能对比条,有趣的是4090和4090D的高度是一样的,但5090和5090D的高度是不同,也就是5090D相对4090D的提升会比5090相对4090的提升更多一些,总之一言难尽吧。另外从对比性能来看,CUDA多了33%,综合性能提升也是大概30%左右,所以新架构嘛更多的是在DLSS4上面发力了,也就是AI方面的发力,从数据来看5090开了光追和DLSS4后性能也出现暴涨。
DLSS4趣味解读:
既然是开了光追和DLSS4后性能出现暴涨,也就是1帧插3帧,有3帧都来自AI绘图算法,所以我们也可以理解画面出现略有不同的情况。这一点就如stable diffusion绘画AI生成一样,相同的提示词或基础画面,生成出来也会不一样。如图上这4个画面,原帧中杯子是白色的,但是DLSS4后杯子是黑色的;桌面、薯条盒子上的细节更多了;杯子上还多了一些条纹。不过整体看DLSS4是大差不差,大家别在意AI给你拉满的细节就好。我只是好奇如果60系列来个8X,1帧生7帧,会不会女的都要长胡子了,白哥会不会变黑哥?我个人感觉AI帧生成真的有极限,除非算法再大幅进步。
对比测试环节:谁才是最可用的平台
国外的性能对比测试很多,我们既然国内只能买到5090D,那我们就好好测5090D。
我们选择了AMD的X870+9800X3D、intel的Z890+245KF、Z790+13600K三大新旧平台对比测试,换RTX5090D或许是必要的,但换平台是否必要得看测试结果。此前我们测试过40系列,各平台的性能差别不大,不知道50系列会如何?游戏方面我们还是选了三个通用游戏,支持DLSS4的赛博朋克2077、霍格沃茨以及不支持DLSS4的黑神话悟空,而且都是特效全开的质量模式,单纯为跑高帧而牺牲画质我认为是没有意义的。
9800X3D+X870E HERO平台,GPU-Z有部分数据没法读取
245KF+Z890平台
13600K+Z790平台
基准测试:
在游戏性能方面,国外测试中5090相对4090平均性能提升大概22%左右,稍微忽略OpenCL的话大概有个30%以上的性能提升,而5090D的平均性能提升大概只有接近20%左右。当然这是忽略DLSS4的前提之下,虽然Tensor AI砍了大概29%的性能,但是依靠DLSS4,还是有惊喜的。 5090毕竟相对4090 CUDA增加33%性能增加30%,功耗貌似也增加了接近30%,在同是4nm的情况下,所以这到底是力大砖飞还是?
RTX5090跑分
RTX5090跑分
RTX5090跑分
RTX5090跑分
RTX5090跑分
对比之前RTX3090、RTX4090的标准跑分
我们简单过一下基准测试,开启了DLSS 4X模式后帧率从80帧暴涨到447帧,通过AI加持带来5.5倍的性能提升,真是炸裂。Time Spy是48220分,而4090大概是36000分左右。Fire Strike Extreme拿到了53862分,4090大概是46000分左右。Port Royal拿到了36092分,4090大概是25000分左右。基准测试方面相对4090有30%-40%以上的巨大提升。
实际游戏测试跑分:
接下来就是我们的重头戏三平台测试,看看哪个平台最能发挥5090D的全部性能。
245KF+Z890平台
13600K+Z790平台
首先是黑神话悟空的BanchMark,三个平台的平均帧都在135左右,基本是一样的,但是LOW帧方面AMD的9800X3D这次就遥遥领先,其最低帧为112帧,而另外两个英特尔兄弟都只有90多帧,差距相当明显。我们再来看看实际游戏测试。
看看优化一般但支持DLSS4的霍格沃茨之遗:
平均延迟方面,9800X3D拿下245KF是毫无悬念的,Ultra200不仅NV不推荐,连存储厂商也不推荐用这个平台测试,还得期待intel的16代好好发力了。好在Z790平台的13600K挣了一口气,无论是平均延迟、1%LOW帧都全面优胜,平均帧的差距也只能用误差来形容。这么看来,难道我们只要换5090显卡就完事了?
那么我们接着看黑神话悟空:
黑神话悟空并不支持DLSS4X,只能支持到2X。9800X3D虽然在平均帧和平均延迟上略微领先,但是在传统优势的1% LOW帧上领先近1倍,要知道30多帧的1% LOW帧是真的会卡的,但60多帧的1%LOW要好很多。当然intel两兄弟差距并不大,13代升级15代就完全没必要了。
好戏在后头,我们接下来再看看经典游戏赛博朋克2077:
AMD 9800X3D彻底三杀,平均延迟低了近20%,1%LOW帧高了30%-35%,平均帧也高了20%-25%,这完全就是代际差距了。
到了结论环节了:
40系列没办法体现9800X3D的优势,到了50系列就非常明显了,难怪NV官方推荐的平台是9800X3D+X870,如果不是intel不争气,想让让英伟达推荐AMD确实不容易。对于一些优化做得比较好的游戏,9800X3D平台的优势非常明显,虽然现在不好买,不过听说AMD要增产X3D产品,等等党确实可以再等等。
所以面对全新的RTX50系列,处理器平台确实已经有了明显的差距,只换显卡虽然能获得一定的性能提升,但对于有钱的游戏玩家来说,我们建议选择9800X3D搭配X870平台,能确保50系列发挥更好的性能。当然5080我们前几天也都拿到了,所以大家可以多参考我们的建议。
来源:天极网