DLSS 4征服4K!影驰GeForce RTX 5080魔刃评测

B站影视 2025-01-29 15:45 1

摘要:相比售价高达16499元的GeForce RTX 5090 D,GeForce RTX 5080更容易被大多数高端玩家接受。它的售价只有GeForce RTX 5090 D的一半,而且拥有目前RTX 50系列中最快的30Gbps显存,同样支持全新DLSS 4技

相比售价高达16499元的GeForce RTX 5090 D,GeForce RTX 5080更容易被大多数高端玩家接受。它的售价只有GeForce RTX 5090 D的一半,而且拥有目前RTX 50系列中最快的30Gbps显存,同样支持全新DLSS 4技术,能够提供出色的4K游戏体验。今天给大家带来的是影驰GeForce RTX 5080魔刃的首发评测。

一、外观设计:附魔符咒元素,锋芒毕露

影驰GeForce RTX 5080魔刃是影驰全新“刃”系列的首批产品,也是“刃”系列中定位最高的一款显卡。“刃”系列的灵感来源于众多神话故事,包含魔刃和圣刃两个系列,前者主色调为黑色,刺破黎明;后者为白色,揭开瘴夜。黑白双色设计为用户提供了更多选择,可以满足海景房玩家对统一色调的需求。

先看包装。影驰GeForce RTX 5080魔刃包装正面中央位置为“刃”系列的英文名“BLADE”和Logo,非常醒目。左上角为影驰Logo,右下角为“GeForce RTX 5080”标识,左下角则标注了“三年质保”及“扫码注册即享个人送保”。背面则印有“刃”系列产品的部分特点,比如新一代霜环风扇、ARGB磁吸信仰灯等。

来到显卡本体,影驰GeForce RTX 5080魔刃的主色调为黑色,整体造型方正凌厉,棱角分明,锋芒毕露,辨识度很高,在众多RTX 50系显卡中独树一帜。显卡本体尺寸为305*125*50mm(不含挡板和ARGB磁吸信仰灯),在高端卡中算是中等身材,对于机箱的兼容性还不错。它也符合SFF-Ready尺寸要求。

影驰GeForce RTX 5080魔刃为三风扇设计,均支持智能启停,三把风扇为90mm霜环风扇,采用环形链结构,扇叶是比较独特的七片三折,理论上可以提供更高的风压,同时风噪更低。三把风扇的四周采用的是磨砂面/镜面相互间隔的倾斜设计,使得显卡正面在视觉上更有层次。其中最左侧磨砂面边缘还有附魔咒符元素贯穿风扇,更添神秘感。最外侧镜面边缘则印有铜色英文“Blade of Chaos, hear my chant, seal thyself, power banished”(混沌之刃听我吟唱,封印自身,放逐力量,于虚空之中陷入沉睡束缚)。

影驰GeForce RTX 5080魔刃的背面采用一块铝质背板,并且核心背面不裸露。背面同样延续正面的间隔倾斜设计,并印有“刃”系列相关标识,同时也有附魔咒符元素。最外侧对应风扇位置为镂空设计,没有任何遮挡,提升热交换效率。

影驰GeForce RTX 5080魔刃的顶部中央为12V-2x6版本供电接口,该卡的TGP为360W,最大400W。中央有附魔咒符元素,并一直延伸到显卡底部。左侧采用镂空设计,增加一组散热风道,镂空位置的两侧还有铜色线条装饰,更加醒目。

影驰GeForce RTX 5080魔刃提供了可更换位置的ARGB磁吸信仰灯,支持GALAX Aurora RGB信仰Logo灯效。右侧及显卡尾部有为ARGB磁吸信仰灯预留的磁吸位置,这一巧思让用户可以根据机箱类型及显卡位置,自行选择将ARGB磁吸信仰灯放置在显卡顶部还是尾部,自由度很不错。无论是横装还是竖装,甚至是安装在A4结构机箱中,灵活的磁吸设计都能够完美展示影驰GeForce RTX 5080魔刃出色的ARGB效果。这在首批GeForce RTX 5080显卡中并不多见。

散热设计方面,除了前面提到的三把90mm霜环风扇、背面及顶部的镂空设计、金属背板外,其散热模组还采用了7根镀镍复合热管,其中包括3根8mm热管和4根6mm热管;均热板不仅覆盖核心,同时还全面覆盖显存,毕竟影驰GeForce RTX 5080魔刃采用的是最新GDDR7显存,并且频率是更高的30Gbps,全面覆盖很有必要。如此豪华的散热设计应对GeForce RTX 5080核心是完全没有压力的。

接口方面,影驰GeForce RTX 5080魔刃采用了3个DP 2.1b+1个HDMI 2.1b的组合,最高可支持4K 480Hz或8K 165Hz画面输出,可以完美支持高端电竞显示器,设备兼容性更加广泛。

二、NVIDIA Blackwell架构解析

本次发布的GeForce RTX 50系显卡由全新的NVIDIA BlackWell架构打造,完整的GB202核心包括12个图形处理集群(GPCs);96个纹理处理集群(TPCs);192个多单元流处理器(SMs),和一个512bit总位宽,包含16个32bit内存控制器的内存接口。

对应到我们熟悉的数字,则是24576个CUDA核心,192个RT Cores;768个Tensor Cores以及768个纹理单元。由于第5代Tensor Cores采用了更高速的FP4运算,完整的GB202可达到恐怖的4000 AI TOPS;而第4代RT Cores采用的新的几何运算模型,也让它可以达到360 RT TFLOPS。

本次评测的RTX 5080则采用GB203核心,配备10752个CUDA核心,84个RT Cores;336个Tensor Cores和336个纹理单元。

另外,每个SM单元中还包含两个FP64内核,总共384个。FP64内核主要目的是确保带有FP64代码的程序可正常运行,并确保准其确性。这对于某些专业领域来说至关重要,比如医学或专业计算领域。

GPC是GPU中占据主导地位的高级模块,所有关键的图形处理单元都位于GPC中。在RTX 50系中,GPC整体的布局变化不大。每个GPC包含一个专用的光栅引擎,两个ROP分区。每个分区包含8个单独的ROP单元和8个TPC,每个TPC包含1个变形引擎和两个SM单元。

完整的GB202核心还包含128MB的L2缓存。大缓存的变更自RTX 40系显卡便已开始,所有程序都可以受益于这个高速大容量的缓存池,而光线跟踪(特别是路径跟踪)等复杂操作将产生巨大的好处。

SM单元是GPU架构中的核心组件,在GPU并行处理中发挥着关键作用,它通过其各种核心(CUDA,Tensor,RT),高效的warp调度,内存管理以及对AI等现代工作负载的支持实现大规模并行。本代RTX 50系显卡中SM单元的变化非常大,下面我们详细来了解一下。

完整的GB202核心包含192个SM单元,每个SM包含128个CUDA核心;1个第4代RT Core;4个第5代Tensor Core;4个纹理单元。1个256KB的寄存器文件和128KB的L1共享缓存,它可以根据图形和计算工作负载的需要配置不同的大小。

在BlackWell架构的SM单元中,INT32整数运算的数量增加了一倍。与Ada架构的SM单元相比,实现了INT32与FP32内核的完全统一。不过在时钟周期内,统一内核只能作为FP32或INT32内核运行。

与BlackWell架构一同推出的还有GDDR7显存,采用pam3信号技术,它有着更高频率与更低电压的特点。

本代RTX 5090配备28 Gbps GDDR7显存,峰值显存带宽可达1792GB/s/秒,而RTX 5080配备更高的30 Gbps时钟频率的GDDR7显存,峰值内存带宽可达960 GB/秒。结合新的引脚编码方案,GDDR7实现了显著增强的信噪比(SNR)。

通过增加信道密度、改进的pam3信噪比、先进的均衡方案、重新设计的时钟架构和增强的I/O训练,GDDR7提供了更高的带宽。这些进步还显著提高了能源效率,提供了更好的性能和延长电池寿命,特别是在移动端,或功率受限的系统中。

BlackWell 第4代RT Core

在第4代RT Core中,简单来说它相比Ada架构,在渲染光线追踪场景时,提供了两倍光线三角形相交测试吞吐量,并引入了Mega Geometry的结构算法。

Opacity Micromap Engine

不透明微引擎在Ada架构中已经引入,这里不再过多讲述,它主要的作用是优化光线追踪渲染,可大幅减轻着色器的工作负担。比如树叶之类的复杂物体,不同的光线都会影响它的表现状态,以及树叶之间的光线反弹,所以对于光线追踪的计算量是巨大的。

不过Opacity Micromap Engine可以将光线追踪特性烘焙到不透明蒙版中,所以那些不规则形状和半透明的对象,也就能够更快更精准的渲染出来,从而极大减轻着色器的工作负担。

Mega Geometry

除了上面提到的Opacity Micromap Engine,在BlackWell架构中,还引入了Mega Geometry(大型几何)的运算概念。其中包含了Triangle ClusterIntersection Engine、Linear Swept Spheres等新硬件。

新的BlackWell RT核心包含一个Triangle ClusterIntersection Engine三角形群集交集引擎,它能够进一步加速大型几何的光线追踪,同时它的工作还包含标准的光线三角形交集测试。Linear Swept Spheres则主要用于光线追踪中精细的几何形状,比如发丝。

Mega Geometry的理念与虚幻5引擎的Nanite虚拟微多边形几何体系统相同,在现代游戏中,模型更加细致,需要渲染的工作量大幅增加,如果全部按照最精细的级别处理,将会耗费极大的计算资源,所以将LOD分级便应运而生。

简单来说,就是根据一个物体距离摄像机的远近,来调节物体的细节水平。此前《黑神话:悟空》便应用了这样的技术,它消除了LOD的繁琐任务,可以扫描并导入极高精细程度的模型。并且,这不会影响性能。仍然可以获得实时帧速率。

在Mega Geometry中提供了新的BVH构建功能,它采用三角形集群作为一级基元。新的集群加速结构Cluster-level Acceleration Structures(CLAS)可以从256个三角形空间紧凑批次中生成,然后使用CLAS集合作为输入来构建最终的BVH。

不过虚幻5引擎并非专为BlackWell而设计,Mega Geometry的工作只是更高效的让游戏引擎调用API。由于其输入参数完全由GPU内存驱动,游戏引擎可以在GPU上更高效的运行LOD选择、动画、剔除等逻辑。同时最大限度减少对CPU的往返,进而减少与BVH管理相关的CPU开销。

然而在更加精细化的游戏引擎中,按照传统的流程,应用程序必须从场景中的每一帧的所有对象中构建一个顶层加速结构。而随着更大的世界规模以及繁杂的场景物体,仅靠LOD分级仍然难以实现质的变化。

为了解决这个问题,Mega Geometry引入了一种新型的顶层加速结构(TLAS),称为分区顶层加速结构(PTLAS)。

它无需在每一帧都从头开始构建一个新的TLAS,PTLAS能够辨别从一帧到另一帧,哪些对象是静态的。应用程序通过将对象聚合到分区中,并仅更新那些已更改的对象来节省开销。

例如,游戏可以将静态游戏世界的各个部分放入所属的分区中,同时将动态对象分离到每帧重建的“全局分区”中。与传统的TLAS相比,请求的分区更新越少,节省的运行时开销就越大。

另外好消息是,Mega Geometry可通过底层API进行扩展支持,适用于所有支持光线追踪的NVIDIA GPU,也就是从图灵架构(Turing)开始。

不过BlackWell的第4代RT Core是专门为Mega Geometry而设计的,硬件中的特殊集群引擎实现了几何和BVH数据的新压缩方案,同时是第3代RT Core光线三角形相交率的2倍。因此,BlackWell架构可以实现用更小的显存,更高效的处理这些内容。

Linear Swept Spheres (LSS)

LSS(线性扫描球体)是BlackWell架构中新增的图形语言,它极大地简化了复杂头发和毛发的渲染开销,并能提升质量。

此前渲染头发仍然需要最基础的三角形来表达物体,如图所示,发丝中的一个线段需要6个三角形,而一根头发便需要无数个三角形来确保其精度。比如我们的头发则需要600万个三角形来表达。

Blackwell架构的RT Core引入了LSS新语言的支持,它类似于镶嵌曲线,允许灵活地近似各种链型。并且球体也更适合发行构建。

LSS的引入可以让发型构建,减少3倍的数据量,速度大约快了2倍,并可以使用更少的显存,获得更高的帧数。

BlackWell 第5代Tensor Core

本代架构除了RT Core进行了改进升级,专门负责AI及高性能计算的Tensor Core也迎来了重大升级。

与NVIDIA Ada Tensor Cores一样,Blackwell架构的Tensor Cores支持FP16、BF16、TF32、INT8、INT4和Hopper的FP8 Transformer Engine。Blackwell还增加了对FP4 Tensor Core操作的新支持,以及新的第二代FP8 Transformer Engine。

FP4精度支持

FP4提供了一种较低的量化方法,类似于文件压缩,可以减小模型大小,提升生成速度。与FP16精度(大多数型号发布的默认方法)相比,FP4只需要不到一半的显存。FP4使用NVIDIA TensorRT提供的量化方法,几乎没有质量损失。

例如,目前最强的AI绘画模型FLUX.dev ,在FP16上需要超过23GB的显存,而这意味着它只能由每一代的期间产品RTX 4090,RTX 5090和专业GPU来支持。

而对于FP4,FLUX.dev测试对显存的需求将少于10GB,让更多80级和70级的显卡均能在本地运行。

在性能和效果对比上,使用带有FP16的RTX 4090,FLUX.dev模型可以通过30个步骤在15秒内生成图像。使用带有FP4的RTX 5090,只需5秒多一点就可以生成图像。

DLSS 4

DLSS 4是本代RTX 50系显卡带来的重大更新,对于玩家来说它也是最能实际感受到的。最新版本DLSS 4带来了新的多帧生成(MFG),具有更快的性能和更低的显存使用等特性。包含超分辨率(SR),光线重建(RR)和深度学习抗锯齿(DLAA)模型,可进一步增强图像质量和稳定性。

其中超分辨率、光线重建、深度学习抗锯齿模型已支持所有RTX 显卡,帧生成技术支持RTX 40系及以上显卡,而多帧生成技术目前仅RTX 50系显卡支持。

Multi Frame Generation(多帧生成)

DLSS多帧生成能够通过每个传统渲染帧,生成多达三帧的额外帧来提高FPS。新的帧生成AI模型相比之前的帧生成方法快40%,使用的显存减少30%,并且每个渲染帧只需要运行一次就可以生成多个帧。高效的AI模型代替了上一代的硬件光流模型,从而加快了光流场的生成速度,并显著降低了生成额外帧的计算成本。

从生成帧的层面来说,上一代DLSS 3帧生成基于CPU的帧节奏,而这种方式可能会让生成的帧与额外的帧混合在一起,导致每帧之间的帧节奏不太一致,影响平滑性。

为了解决生成多帧的复杂性,Blackwell架构使用硬件flip metering将帧节奏逻辑转移到显示引擎,使GPU能够更精确地管理显示时序,从而避免与额外帧混合的情况,进而提升帧生成的准确性及稳定性。

而第5代Tensor Cores拥有更高的计算能力,这使得它们能够更快地执行计算光流和生成多帧的一系列AI模型。并更好地调度DLSS AI处理、图形渲染和帧速度算法。

Transformer模型

此前DLSS所用的模型为Convolutional Neural Network,即我们熟悉的卷积神经网络(CNN),CNN的工作原理是将像素局部聚集在一起,并以树的形式从低到高地进行分析数据。这种结构的计算效率很高,这也是为什么它被称为卷积神经网络。

而DLSS 4引入了基于Transformer的AI模型,用于DLSS超分辨率、DLSS光线重建和深度学习抗锯齿(DLAA),从而提高图像质量和渲染平滑度。基于Transformer模型体系结构的神经网络,擅长处理涉及顺序和结构化数据的任务。简单来说,就是Transformer能够抓住“重点”,可以更好地理解和渲染复杂场景。

与CNN模型相比,Transformer更容易在更大的像素窗口中识别更远距离的模式,具有一定的学习能力和“前瞻性”。

本代DLSS 4将基于CNN的神经网络结构,转变为基于Transformer的神经网络结构,在许多场景下图像质量都有着显著提升。

Shader Execution Reordering (SER) 2.0

Shader Execution Reordering(着色器重排序)是在RTX 40系架构中引入的一项技术,它可以使带有光追的程序有效地重组GPU上的大量并行线程,以最大限度地利用硬件。

因为连贯执行神经工作负载的线程可以直接发送到Tensor Core,所以SER也显著加速了神经着色。在Blackwell架构中,SER的核心重排序逻辑效率是原来的两倍,减少了重排序开销并提高了精度。从而进一步提高了该功能的有效性。这项功能更多地是为应用程序开发者而设计,它仅需一个小的API改动,即可执行重排序操作,进而提升总体项目的负载性能。

三、理论性能测试

以下是此次测试所使用的平台。为了保证显卡的性能表现,处理器选择了目前非常强悍的游戏神U——锐龙7 9800X3D,尽量降低处理器所产生的瓶颈。

通过GPU-Z可以看到影驰GeForce RTX 5080魔刃的规格。其拥有10752个CUDA核心,基础频率为2295MHz,Boost频率为2617MHz。光栅和纹理单元分别为112个和336个。采用16GB GDDR7显存(软件未识别),显存位宽256bit,带宽960GB/s(软件识别错误)。驱动版本为572.02。

为了更为直观的体现影驰GeForce RTX 5080魔刃的性能表现,此次选择了GeForce RTX 4080 SUPER作为对比对象。

首先是衡量显卡DX11的3DMARK FS套装:FS、FSE和FSU三者分别对应显卡在1080P、2K和4K的理论性能,取显卡分数实际测试结果如下:

在FS测试中,影驰GeForce RTX 5080魔刃相比RTX 4080 SUPER,其中FS提升10%;FSE提升17.6%;FSU提升20.4%,综合提升约16%。

在衡量DX12性能的Time Spy和Time Spy Extreme测试中,影驰GeForce RTX 5080魔刃相较RTX 4080 SUPER的提升分别为:TS提升14.1%;TSE提升14.5%,综合约为14.3%。

Port Royal是3DMARK中专门针对光追性能的测试项,影驰GeForce RTX 5080魔刃相较RTX 4080 SUPER的提升约为21.6%。

Speed Way这项测试结合了实时光线追踪和传统渲染技术来测量显卡性能。场景含有光线追踪反射、实时全局光照、网格着色器、体积照明、粒子和后处理效果。所以SW的测试基本可以看做次世代3A游戏基准。影驰GeForce RTX 5080魔刃对比RTX 4080 SUPER,提升幅度约21.4%。

最后是DLSS理论性能测试。从结果可以看出,DLSS 3(CNN)与DLSS 4(2X)的表现非常接近,不过DLSS 4(4X)的提升幅度就非常可观了。相比DLSS 3,2K/4K/8K下DLSS 4 (4X)的提升幅度分别为51.4%/73.1%/76.4%,效果及其明显。

综合来看,相比RTX 4080 SUPER,影驰GeForce RTX 5080魔刃有着比较可观的性能提升,DX11综合提升约16%,DX12综合提升约14.3%,光追性能综合提升约21.6%。最大的提升莫过于DLSS 4技术,相比上一代DLSS 3可以说是突飞猛进,甚至让8K游戏不再是幻想!

下面我们重点看一下DLSS 4在实际游戏中的表现到底如何。

四、DLSS 4游戏性能测试

本次DLSS 4在正式发布首日,便可支持75款游戏和应用。除了游戏中首发支持外,对于尚未集成的游戏,可在NVIDIA APP优设功能中进行直接调节非常方便。

首先是《赛博朋克2077》。以下测试军固定缩放比例,选择在DLSS质量档下进行。

在DLSS 2下,影驰GeForce RTX 5080魔刃在1080P和2K下的表现还不错,即使是在光线加速画质下,依然能够提供超过60帧的帧数。不过在4K分辨率下略显吃力,平均39帧的成绩无法保证良好的体验。

在DLSS 3下,4K分辨率下的表现就好很多了,即使光追加速画质下也能够达到平均70帧的成绩,能够保证良好的游戏体验。

在DLSS 4下,影驰GeForce RTX 5080魔刃的表现就亮眼多了,在4X下,4K光追加速画质档能够达到128帧。而在2K和1080P下更是超过了200帧和300帧。在超级画质下,1080P下更是达到了夸张的平均588帧!在这以往是难以想象的!

除了帧数的暴增之外,得益于Transformer模型,游戏画面在材质纹理方面提升了不少,交互场景的锯齿边缘得到了有效柔化,闪烁现象也得到了显著改善,视觉体验更为出色。

其次是近期大火的《漫威争锋》。

在DLSS 3下,得益于影驰GeForce RTX 5080魔刃强劲的硬件实力,即使在4K分辨率原生画质下,也能够达到平均119帧的成绩,平衡档则能够稳定接近160帧。

在DLSS 4下,游戏的帧数得到了大幅提升,4K原生画质下就已经来到平均220帧,平衡档下更是接近300帧。1080P下也非常夸张,原生平均496帧,平衡档平均558帧,超级性能档下甚至达到了平均619帧!目前职业1080P电竞显示器中最高刷新率为600Hz,影驰GeForce RTX 5080魔刃能够轻松满足。

五、常规游戏性能测试

除了支持DLSS 4的游戏,我们同样测试了一些主流的3A大作和支持DLSS 3的游戏,为更多玩家提供参考方向。

首先是国产3A游戏的代表作《黑神话:悟空》。

在非光追影视级画质+DLSS 3下,影驰GeForce RTX 5080魔刃的表现相当不错,即使在4K原生画质下,依旧能够提供接近70帧的帧率,平衡档下已经超过平均100帧,超级性能下甚至接近平均130帧,流畅度完全没有问题。

开启光追之后,《黑神话:悟空》给硬件带来的压力十分巨大,好在有DLSS 3的加持,即使4K分辨率下,在平衡档也能够保持平均74帧。比较有意思的事,光追+DLSS 3在低分辨率下似乎有额外加成,在超级性能档下的平均帧数甚至比不开光追还要高一些,确实有些反直觉。

其次测试的游戏是《燕云十六声》。

测试《燕云十六声》时出现一个问题,那就是2K和4K分辨率下的成绩基本一致,可能是因为游戏对于高分辨率的优化还有所欠缺。即使如此,影驰GeForce RTX 5080魔刃的表现依旧非常给力,2K平衡档下能够接近平均200帧,1080P原生画质下就已经超过平均200帧,超级性能下甚至超过了平均280帧,流畅度非常不错。

接下来测试的游戏是《三角洲行动》。

影驰GeForce RTX 5080魔刃在《三角洲行动》中的表现同样给力,4K平衡档下超过了平均200帧,2K原生画质下也超过了平均200帧,而在1080P下,即使是DLSS质量档也高达平均440帧,性能档下更是接近平均500帧,流畅度极为出色。

接下来测试的游戏是《极限竞速:地平线5》。

《极限竞速:地平线5》对于硬件的要求稍微高一些,不过对于影驰GeForce RTX 5080魔刃来说依旧毫无压力。DLSS 3下,即使4K分辨率也能够提供平均190帧的成绩,这样的流畅度对于这款赛车游戏来说已经绰绰有余了。

接下来测试的游戏是《刺客信条:幻景》。以下是关闭自适应帧率后得到结果。

可以看到,影驰GeForce RTX 5080魔刃运行《刺客信条:幻景》也是轻轻松松,4K分辨率平衡档下可以达到平均142帧,2K下能达到平均188帧,1080P下轻松超过200帧。2K和1080P的超级性能档下,均超过了平均200帧的成绩。

接下来测试的游戏是《无主之地3》。

《无主之地3》为纯光栅化游戏,对比RTX 4080 SUPER,影驰GeForce RTX 5080魔刃在1080P/2K/4K下的帧率提升分别为5.6%/10.1%/16.8%,在2K和4K下的平均提升幅度与前面DX12理论性能测试(平均提升14.3%)比较接近。

最后看一下国产游戏《光明记忆:无限》。

从测试结果来看,影驰GeForce RTX 5080魔刃的表现非常不错,4K下依然能够提供超过平均60帧的成绩。相比RTX 4080 SUPER,在1080P/2K/4K下的帧率提升分别为10.5%/14.9%/17.9%。

六、AI性能测试

AI性能方面,此次选择的软件是UL Procyon的最新测试程序FLUX.1 AI Image Generation Demo for NVIDIA。特别是其提供了对显存非常友好的FP4测试(相同的模型在FP16下运行需要至少23GB显存,而FP4仅需一半显存即可),对于非专业卡用户来说很有参考意义。

BlackWell架构新的Tensor Core特性不仅让生成所需的显存显著减少,在生成时间也有大幅降低,而最终生成的图片质量几乎没有损失(下图上为FP4渲染生成,下为FP8渲染生成)。从测试结果来看,影驰GeForce RTX 5080魔刃的AI生图速度相当可观,平均4张图片即可节省20秒左右的时间。

除了AI处理速度的提升外,新版NVIDIA Broadcast也针对视频效果引入了部分AI效果,比如目光接触功能,它解决了视频会议时目光朝下的问题。目光接触功能的实际效果还是挺不错的,非常自然,即使戴眼镜也不影响效果。

七、功耗及温度测试

最后进行的是功耗及温度测试,使用的软件为FurMark2,对影驰GeForce RTX 5080魔刃进行30分钟拷机测试。

由于FurMark 2对于部分信息的识别有误(显存温度有误),所以我们以AIDA64显示的数据为准(蓝色部分)。可以看到影驰GeForce RTX 5080魔刃的整卡功耗可以稳定在360W左右,此时核心温度为68℃,显存温度也是68℃。相比公版GeForce RTX 5080(参考数据,公版功耗360W,核心71℃,显存70℃),影驰GeForce RTX 5080魔刃凭借更强大的散热设计,在温度方面的表现要更为出色。

此外我们也看一下开启DLSS 4(4X)之后的延迟表现,测试程序为《赛博朋克2077》的Benchmark,画质选择4K光追加速。从实际检测的延迟来看,开启DLSS 4(4X)后的延迟表现依旧非常不错,平均延迟只有48ms。这意味着AI帧生成过程中并没有造成延迟增加的问题,游戏操控依旧跟手。

八、总结

影驰GeForce RTX 5080魔刃给我留下最深印象的,莫过于DLSS 4技术所带来的帧数爆炸式增长!DLSS 4技术就像魔法一样,在保证游戏画质的前提下,让4K,甚至8K游戏成为现实!这是仅通过堆核心规模难以取得的成绩。在摩尔定律已经失效、制程工艺逼近极限的当下,DLSS 4显然就是提升游戏体验的最优解。

而且相比较价格高昂的GeForce RTX 5090 D,影驰GeForce RTX 5080魔刃显然是高端玩家更合理的选择。在NVIDIA Blackwell架构及以DLSS 4为代表的全新技术加持下,它有着强劲的游戏实力,即使面对对硬件要求极高的3A大作,比如《黑神话:悟空》(后续将支持DLSS 4)、《赛博朋克2077》等,在4K光追最高画质下依旧能够提供超过100帧的成绩,可以说完全征服了3A大作;面对热门网游,最高游戏帧率甚至突破600帧,提供专业电竞级游戏体验。

同时相比公版GeForce RTX 5080,影驰GeForce RTX 5080魔刃凭借更强劲的散热系统实现了更低的核心温度和显存温度,长时间运行游戏的稳定性更为出色。

对于游戏体验有较高要求的玩家来说,影驰GeForce RTX 5080魔刃可以说是首批GeForce RTX 5080非常值得关注的产品,它所提供的游戏体验,绝对会让你赞叹不已。该显卡和同系列的圣刃都将于1月30日上架开售,感兴趣的朋友可以关注下。

来源:中关村在线

相关推荐