摘要:采用全新Blackwell架构的RTX 5090 D终于在1月24日正式迎来性能解禁时间点。华硕全新打造的ASTRAL夜神系列发烧级游戏显卡也在第一时间加入了RTX 5090 D的型号,其中的ROG ASTRAL夜神RTX5090 D O32G GAMING(
采用全新Blackwell架构的RTX 5090 D终于在1月24日正式迎来性能解禁时间点。华硕全新打造的ASTRAL夜神系列发烧级游戏显卡也在第一时间加入了RTX 5090 D的型号,其中的ROG ASTRAL夜神RTX5090 D O32G GAMING(以下简称RTX 5090 D夜神),则堪称比ROG STRIX系列更高端的信仰级旗舰神器。
ROG ASTRAL 夜神 RTX 5090 D上机搭载展示
RTX 5090 D官方规格介绍
▲RTX 5090 D采用GB202芯片(上图),在此基础上减少了一部分SM单元和编解码器
RTX 50系采用了全新打造的Blackwell架构,有关Blackewell架构的技术解析请参考我们之前的文章(https://mp.weixin.qq.com/s/cbgJPeUMvKPtrQcx_zPXAw),这里就不再赘述,而是直接进入GPU规格介绍环节。
RTX 5090 D GPU采用GB202芯片,这款GPU芯片面积高达744mm²,相对上代RTX 4090 D的AD202芯片增加了大约22%,CUDA单元数量提升了49%,升级幅度非常可观。
由于新架构改进了设计,RTX 5090 D内置的第四代RT Core和第五代Tensor Core相对上代RTX 4090 D巨幅提升,算力升级幅度分别达到了87%和102%。考虑到Blackwell整体设计思路就是面向AI渲染和新的DLSS 4黑科技,所以这样的升级也完全合理。
传统的纹理单元和光栅单元方面,RTX 5090 D相对RTX 4090 D分别提升了49%和9%。显存部分,RTX 5090 D是全球首款使用GDDR7的GPU,显存位宽更是达到了512bit,传输速率提升到28Gbps,因此显存带宽相对RTX 4090 D增加了78%,不管是对于高分辨率光追游戏还是AIGC应用,显存系统的大幅升级都会带来更多的收益。
视频编解码器方面,RTX 5090 D搭载了三个第九代编码器和两个第六代解码器,相对RTX 4090 D的两个第八代编码器和一个第五代解码器来讲也是巨幅升级。而且RTX 5090 D增加了对H.265/10bit/4:2:2格式视频编解码的支持,实用性也大大增加。
RTX 5090 D官方给出的整板功率为575W,配备16Pin辅助供电,而像RTX 5090 D夜神这样的超公版,则会将功率上限升级到600W,从而提供更强的性能。
接下来就让我们一起看看RTX 5090 D夜神显卡实物。
ROG ASTRAL夜神RTX5090 D O32G GAMING图赏
ROG ASTRAL夜神RTX5090 D O32G GAMING采用了全新的ROG Astral系列外观设计,灵感源自广袤无垠、美轮美奂的宇宙,彰显对探索与开拓新边界的不懈追求。从整体视觉来看,相对之前的ROG STRIX系列显得更加沉稳大气,定位也更高。
ROG ASTRAL 夜神 RTX5090 D创新使用了四风扇设计,除了正面三个轴流风扇之外,还在背面进气格栅位置添加了一个风扇,提升20%气流和风压,带来更好的散热效果。此外,显卡还搭载了华硕专利真空腔均热板、MaxContact镜面直触技术、3.8槽散热片、相变GPU导热垫,为RTX 5090 D提供强大的散热支援。
用料部分,ROG ASTRAL 夜神 RTX5090 D配备了80A晶体管,比标准规格高出35%的功率支持,大幅增强了供电稳定性和超频潜力。显卡还使用了保护性电路涂层,采用全自动化制程,有效提升了显卡的可靠性和耐用度。因此,它的整板功率上限高达600W,相比公版的575W规格更高,GPU频率也提升到了2580 MHz,高于公版的2410 MHz,性能自然也高于公版。
此外,ROG ASTRAL 夜神 RTX5090 D还配备了超硬的金属外壳,采用压铸金属框架、护盖、背板和304不锈钢I/O挡板,配备显卡支架,让显卡的防护能力达到超高的水准。
在显卡顶部,可以看到显卡提供了双FanConnect II风扇接口,可以将机箱风扇直接连接到显卡上,根据CPU和GPU温度来调节风扇转速,改善整个机箱的散热环境。
显卡配备16pin辅助供电接口,同时还提供了双BIOS开关,可以在静音模式和性能模式之间快速切换,满足玩家不同的使用需求。
个性化方面,显卡当然支持AURA SYNC神光同步,而且在顶部提供了一条灯带,视觉效果酷炫而不过分张扬。
接口部分,显卡提供了三个DP 2.1b和两个HDMI 2.1b,最多可以支持四屏输出。
接下来,让我们看看它在测试中的实战表现。
实战测试:DLSS 4威力惊人,4K帧率暴数百
测试平台
显卡:ROG ASTRAL 夜神 RTX5090 D
处理器:锐龙7 9800X3D
内存:佰维DDR5 6000(C28) 16GB×2
主板:ROG CROSSHAIR X870E HERO
硬盘:WD_BLACK SN850X 2TB
电源:ROG雷神Ⅱ1600W
操作系统:Windows 11专业版24H2
测试平台部分,我们选择了锐龙7 9800X3D,将处理器部分的瓶颈效应控制在最小,同时还使用上代的RTX 4090 D与之进行对比。此外,考虑到RTX 5090 D的定位和发烧级玩家实际的使用环境,我们本次游戏实测都使用4K分辨率。
DLSS 4应用与游戏测试
▲DLSS 4可以让游戏帧率暴增数倍,同时提供更好的画质,让4K游戏也能达到电竞级几百帧的流畅度
本次RTX 50系最大的升级就是带来了DLSS 4,在全新Transformer模型加持下,DLSS 4不但能够提供更好的画质和效率,还能通过多帧生成技术巨幅提升游戏帧率,让4K游戏大作能够实现像电竞网游那样数百帧的超高流畅度。因此,我们决定先来看看DLSS 4游戏测试的情况。
首发宣布支持DLSS 4的游戏有75款,到目前为止已经有一部分随着RTX 5090 FE的性能解禁更新了对DLSS 4的支持补丁。当然,由于我们测试在此时间之前已经完成,所以使用的是NVIDIA提供的几个游戏的DLSS 4测试分支。在原生支持DLSS 4的游戏中,我们可以选择多帧生成的倍率(4×、3×、2×),而在非原生支持DLSS 4的部分游戏中,我们也可以通过NVIDIA APP来设置使用的模型(新的Transformer或者上代的CNN)与多帧生成倍率。
在3DMark新增的DLSS 4测试中,开启4×多帧生成的RTX 5090 D领先只支持2×帧生成(DLSS 3)的RTX 4090 D的幅度高达162%。同时,我们也可以看到,开启4×帧生成之后,RTX 5090 D的帧率相对原生帧率提升了449%,相对RTX 4090 D的原生帧率提升幅度更是高达714%,可见DLSS 4的多帧生成效果确实非常给力。
▲RTX 5090 D在4K极限光追画质设置下的《赛博朋克2077》中开启DLSS 4 和多帧生成
在《赛博朋克2077》的DLSS 4测试分支版本中,我们可以详细比较RTX 5090 D使用Transformer模型的DLSS 4模式不同倍率帧生成设置下的帧率,也可以比较CNN和Transformer模型同在2×帧生成下的效率(使用CNN模型的DLSS 3只支持2×帧生成)。在DLSS 4模式下,启用4×、3×和2×帧生成,RTX 5090 D的帧率相对原生分别提升746%、571%和377%。同时,使用Transformer模型实现2×帧生成相对DLSS 3的CNN模型也有7%的帧率提升。RTX 4090 D在《赛博朋克2077》中只能选择使用CNN模型的DLSS 3模式,因此只支持2×帧生成,而拥有4×帧生成的RTX 5090 D帧率比它高160%,相对它的原生帧率更是提升了夸张的1038%。
▲RTX 5090 D在4K极限光追画质设置下的《霍格沃兹之遗》中开启DLSS 4 和多帧生成
《霍格沃兹之遗》的测试分支中,4×帧生成和3×帧生成使用了Transformer模型,在2×帧生成模式下,则使用了CNN模型。RTX 5090 D使用DLSS 4和4×帧生成,相对原生的帧率提升了309%,3×提升了195%,使用上代的DLSS 3 + 2×帧生成模式提升了97%。和RTX 4090 D的DLSS 3 + 2×帧生成相比,最高提升幅度达到了108%,和RTX 4090 D原生帧率比,提升幅度最高432%。此外,从我们的测试来看,使用4×帧生成的渲染延迟与平均PC延迟与2×帧生成相比并没有明显变化,所以大家完全不用担心这个问题。
▲RTX 5090 D在《漫威争锋》中使用Override模式开启DLSS 4和多帧生成
《漫威争锋》可以在NVIDIA APP中使用Override模式来开启DLSS 4和多帧生成。在 4×/3×帧生成模式下,RTX 5090 D的帧率相对于原生分别提升了289%和217%,而在2×帧生成模式下,使用Transformer模型相对CNN模型也提升了6%。RTX 5090 D采用4×帧生成的帧率相对采用DLSS 3 + 2×帧生成的RTX 4090 D提升了137%,和原生比更是提升了419%。延迟部分,可以看到RTX 5090 D在几种帧生成比例下的渲染延迟与PC延迟差别都很小,可见对于玩家来讲直接启用DLSS 4的4×帧生成无疑是获得高帧率和流畅操作的最佳选择。
▲RTX 5090 D在D5渲染器中使用Override模式开启DLSS 4和多帧生成也可以大幅提升预览帧率
DLSS 4在3D渲染类生产力软件中也能大幅提升预览效率,目前D5渲染器可以通过Override模式来支持DLSS 4和多帧生成。开启DLSS 4和4×帧生成,RTX 5090 D的帧率相比原生(关闭超分辨率、光线重建和帧生成)提升了291%,比DLSS 3和2×帧生成模式的RTX 4090 D提升了207%,比它的原生帧率提升了561%。可以说这对于设计师用户来说堪称史诗级的体验升级。
基准性能测试
前面DLSS 4的测试成绩确实让我们非常惊喜,而接下来我们继续从基准测试项目来了解RTX 5090 D在规模提升之后相对上代的常规理论性能提升。
3DMark的DX11和DX12光栅化渲染测试项目中,RTX 5090 D相对RTX 4090 D的优势都超过了35%,在DX12项目中的优势更高一些,最高甚至可达44%。在DX12U和光追项目(SpeedWay和Port Royal)中,RTX 5090 D的优势更大,最高的项目提升了57%,新的光追单元效率确实更高。综合传统基准性能部分的成绩来看,RTX 5090 D平均领先RTX 4090 D的幅度大约为44%。
常规游戏性能测试
接下来我们看看4K极限画质设定下光栅化游戏性能的表现。RTX 5090 D相对RTX 4090 D的平均帧率提升幅度从24%到59%不等,平均提升幅度大约为35%,其中《赛博朋克2077》《永劫无间》提升幅度都非常惊人,都超过了50%。而在影响游戏流畅度的1% Low帧方面,RTX 5090 D在《博德之门3》中甚至领先了RTX 4090 D大约60%,综合全部游戏平均领先的幅度是34%。
光追与DLSS游戏测试
在打开光追和DLSS(CNN模型)的主流3A游戏中,RTX 5090 D相对RTX 4090 D的平均帧优势大约在16%~39%,平均升级幅度大约为29%。1% Low帧部分,RTX 5090 D相对RTX 4090 D的领先幅度最高达39%,平均领先21%。可见无论是绝对帧率还是游戏平滑度,RTX 5090 D都是大幅超越上代RTX 4090 D的存在。
生产力性能测试
RTX 5090 D提供了更多的CUDA单元和更为强大的32GB/512bit/GDDR7显存,因此在各种3D设计工具软件中也会提供更高的执行效率。从测试结果来看,RTX 5090 D在Blender中相对RTX 4090 D有32%~45%的提升;在V-Ray GPU RTX渲染中有37%的提升;在SPECView2020V3.1中的平均提升幅度则为12%。由此可见,对于经常要用到3D设计工具的用户来讲,RTX 5090 D相对上代提升巨大,是更加高效的升级选择。此外,RTX 5090 D新增了对4:2:2/10bit格式视频编解码的支持,我们使用Davinci Resolve 19 + Voukoder进行了编码测试对比,有明显的提升。
▲RTX 5090 D在剪映中可以同时流畅解码5条H.265/4:2:2/10bit视频不掉帧,而锐龙9 9950X这样的旗舰U在面对这样的解码需求时也会严重卡顿
RTX 5090 D在视频解码方面同样十分强大,它配备的两个第六代解码器在剪映中可以同时流畅解码5条H.265/4:2:2/10bit视频不掉帧。但如果用CPU解码,就算是拥有16核32线程的锐龙9 9950X也会出现严重卡顿。可见对于视频剪辑师来说,RTX 5090 D新一代的编解码器确实会带来更高的工作效率。
AI性能测试
▲RTX 5090 D在UL Procyon的AI出图测试中使用FLUX.1模型/FP4精度设置,显存占用大约20GB,比FP8模式降低了5GB左右,效率也高出大约70%
Blackwell架构的一大革新就是内置的第五代Tensor Core支持FP4精度的计算,相对Ada架构的Tensor Core性能提升了一倍。我们这里使用UL Procyon的AI生图测试来考查RTX 5090 D的在FP8和FP4精度下的AI性能。
从测试来看,同样使用FLUX.1模型生成1024×1024的图片,RTX 5090 D在FP4下的出图速度相当于FP8模式下的170%,显存占用也减少了20%左右。RTX 4090 D不支持FP4模式,所以从FP8模式切换到FP4模式出图时间几乎增加了一倍。RTX 5090 D在FP4模式下出图速度大约比RTX 4090 D快了413%。由此可见,对于需要快速AI出图、且对精度要求并不苛刻的用户来讲,支持FP4精度的RTX 5090 D无疑是高效神器。
功率与温度表现
▲RTX 5090 D夜神满载考机整板功率600W,GPU温度在66℃左右,风扇噪声也控制得很好
我们对RTX 5090 D夜神进行满载考机测试,可以看到这时候整板功率达到了600W上限,GPU功率则保持在230W水平。得益于3.8槽的四风扇散热器,RTX 5090 D夜神的GPU考机温度仅有66℃左右,噪声也控制得很好,达到了旗舰风冷显卡中的顶级水平,即便发烧级玩家长时间高强度玩游戏或AI创作,也不用担心过热的问题。
总结:信仰卡皇,尝鲜DLSS 4与AI渲染的终极选择
Blackwell架构从硬件层面完成了从传统渲染时代到AI渲染时代的进化,突破了制造工艺、功率等硬件条件带来的性能瓶颈,为业界指明了GPU设计的方向。毫无疑问,未来的GPU完全拥抱AI是不可阻挡的趋势,NVIDIA在这方面是没有争议的领军者,整套生态圈的优势无可匹敌。
以Blackewell架构为基础,RTX 5090 D带来了一系列基于AI技术的新功能,为玩家提供了更加极致的游戏体验。RTX 50系GPU独享采用Transformer新模型的DLSS 4以及多帧生成技术,不但可以让游戏帧率暴增数倍,还可以实现比DLSS 3更好的画质,这对于发烧级玩家来说确实拥有不可抵挡的吸引力。
在AI和生产力方面,RTX 5090 D新增对FP4精度的优化支持,能够提供更快的AI计算速度(也为AI渲染提供了强大的硬件基础),同时它还拥有当前最高规格的32GB/512bit/GDDR7显存配置,对于AIGC用户来讲是当下最高效的工具。此外,它还内置了3×第九代编码器和2×第六代解码器,新增支持4:2:2/10bit编解码,对于视频剪辑用户来说也能大幅提升工作效率。此外,在3D设计方面,RTX 5090 D也提供了远超上代RTX 4090 D的性能。综上所述,对于追求极致效率的设计师用户来讲,RTX 5090 D是目前毫无争议的顶配之选。
RTX 5090 D夜神作为RTX 5090 D中的信仰级旗舰代表作,拥有600W的顶级性能释放能力,配备强大的3.8槽四风扇散热系统,拥有全新打造、霸气十足、坚固无比的旗舰外观,确实堪称专为发烧级玩家和高端设计师用户打造的信仰级卡皇。
来源:电脑报