DLSS4大力加持,是性能怪兽?技嘉RTX 5080 GAMING OC 魔鹰评测

B站影视 2025-01-30 23:07 2

摘要:在 2025 年的国际消费类电子产品展览会(CES 2025)上,英伟达的创始人兼首席执行官黄仁勋隆重推介了基于全新 Blackwell 架构的 GeForce RTX 50 系列显卡。这一消息宛如一颗重磅炸弹,迅速引发了整个行业的广泛关注。特别是系列中的旗舰

前言:

在 2025 年的国际消费类电子产品展览会(CES 2025)上,英伟达的创始人兼首席执行官黄仁勋隆重推介了基于全新 Blackwell 架构的 GeForce RTX 50 系列显卡。这一消息宛如一颗重磅炸弹,迅速引发了整个行业的广泛关注。特别是系列中的旗舰产品 GeForce RTX 5090,凭借其卓越的性能,成为众人瞩目的焦点。与此同时,次旗舰 RTX 5080 也凭借其出众的性能表现与紧凑的SFF READY尺寸,吸引了众多游戏玩家和硬件爱好者的目光。

技嘉 GeForce RTX 5080 GAMING OC 魔鹰 16G显卡(下述简称“技嘉RTX 5080魔鹰”)是技嘉在 RTX 5080 系列显卡中的核心产品之一。虽然它并非顶级旗舰显卡,但在中高端市场中却拥有不可忽视的影响力。该产品承袭了技嘉 GAMING OC系列的设计理念,在性能、散热和用料等方面都表现出色,致力于为玩家提供稳定而强大的图形处理能力,满足游戏、创作等多种场景的使用需求。本文将对其进行全方位地解析,揭示其在性能、技术、设计等方面的亮点与特色。

技嘉 GeForce RTX 5080 GAMING OC 魔鹰 16G,规格介绍

在评估显卡性能之前,我们首先来了解一下技嘉RTX 5080魔鹰显卡的规格,其显示核心为 NVIDIA GeForce RTX 5080,基于全新的 Blackwell 架构,相较于上一代,在架构层面就带来了性能的飞跃。而先进的架构使得显卡在光线追踪、DLSS4 、AI性能等方面的运用上更加高效,能够为用户带来更逼真的游戏画面和更流畅的游戏体验。

作为一款非公版显卡,技嘉RTX 5080魔鹰显卡搭载了更高的核心Boost频率、更强大的PCB设计,以及更为出色的散热系统。在核心频率方面,技嘉RTX 5080魔鹰显卡的基础频率与RTX 5080 FE保持一致,但在Boost频率上实现了显著的提升,达到了2730MHz。此外,技嘉RTX 5080魔鹰显卡还配备了双BIOS模式,允许用户在性能模式和静音模式之间轻松切换。

因此,从纸面数据来看,技嘉RTX 5080魔鹰显卡在性能、散热以及噪音控制方面均优于FE公版。如果定价合理,这款显卡无疑将在同级别产品中展现出强大的竞争力。

Blackwell架构简介:

Blackwell架构首次亮相是在去年的GTC 2024技术大会上,正如 CEO所言:“Blackwell GPU是推动新一轮工业革命的引擎”。基于Blackwell GPU架构的B200与GB200 Grace Blackwell超级芯片凭借其卓越的性能,再次超越众多竞争者,成为AI行业史上最强的产品。

GeForce RTX 50系列显卡同样采用了Blackwell架构,尽管在规模和规格上存在显著差异。自Ada Lovelace架构以来,NVIDIA便对数学家们情有独钟,而此次Blackwell架构的命名也源自一位数学家——大卫·布莱克威尔,一位备受尊敬的数学家和统计学家,在博弈论和统计学领域作出了不可磨灭的贡献。

NVIDIA以他的名字命名这一架构,体现了新平台的创新性和卓越的计算能力。Blackwell架构是NVIDIA近年来更新幅度最大的GPU架构,相较于以往的架构,它革命性地引入了神经网络着色器,旨在为游戏创造先进、高效且更逼真的渲染方式,为玩家带来全新的游戏体验。

相比前代Ada架构,Blackwell的升级聚焦于四大方向:分别是AI算力的爆发、光线追踪技术的革新、显存能效的提升以及划时代的神经网络渲染。

第五代Tensor核心

其中AI算力的爆发就不得不提到Blackwell架构上的第五代Tensor核心,新一代Tensor Core添加了对FP4浮点运算精度的支持。FP4是一种较低的量化方法,类似于文件压缩,可以减小模型推理过程中数据存储和计算量大小,提高计算效率,降低该过程对显存的要求。与大多数模型默认使用的FP16相比,FP4使用的显存不到其一半,并使GeForce RTX 50系列GPU的性能相比上一代提升高达2倍。

第四代RT核心

而光线追踪技术的革新则仰赖于第四代RT核心的加持,相较于第三代RT核心来说,Blackwell架构的第四代RT核心主要提升了检测光线、路径与三角形相交的效能,过往在检测时往往只能检测单个三角形,一旦场景复杂,检测能力不足就容易导致渲染出错等问题,而现在检测能够以簇集方式进行,检测效率更高。同时还有三角形簇集解压缩引擎加持,其新增了Linear-swept Spheres(LSS)功能,可以减少渲染毛发所需的几何图形数量,并使用球体代替三角形以获得更准确的毛发形状拟合,能够让显卡发挥更好的性能但只消耗较小的显存占用。

综合来看,Blackwell架构的光线追踪多边形相交效率是上一代Ada架构的2倍,是Turing架构的8倍,同时还可以节省25%的显存使用率。

第四代RT核心的改进主要是为实现更好的光追效果。其中有两项新技术能够受益,第一项是RTX Mega Geometry技术。随着光线追踪游戏场景的几何复杂性不断增加,游戏画面中几何图形的计算量也呈现出快速增长的趋势。而RTX Mega Geometry技术能够加速构建边界体积层次结构(BVH),使得在实时渲染中可以处理多达100倍的三角形数量。

该技术的出现,也使得开发者能够在游戏场景中使用更复杂的几何图形,而不会影响游戏帧率。过去需要一个个算BVH,现在RTX Mega Geometry能够智能地在GPU上批量更新三角形簇,减少了CPU的负担,既保证了性能,也兼顾了图像质量。相信随着这些技术的不断发展和应用,未来的游戏将能够呈现出更加逼真和细腻的视觉效果,同时保持高效的性能表现。

另外一个能够受益的技术则是Curve Primitive,方便光追在曲面中的应用,例如一位男士的头发可能需要多达400万个三角形,再加上光线追踪技术,画面所需要的运算负载极大。NVIDIA则通过第四代RT核心中的Linear- Swept Spheres(线性扫描球体)技术有效减少了渲染头发所需的几何体数量,以球形代替多边形,更贴合头发的形状,从而将内存占用量大幅缩减至三分之一,并进一步提升了实际帧数,让头发的渲染效果更加自然流畅。

GDDR7显存

第三点改变则是显存效率的提升,Blackwell架构中还首次加入了对GDDR7显存的支持,此前GDDR6显存的信号编码为NRZ/PAM2,而RTX 40系上的GDDR6X则是PAM4编码。最新的GDDR7显存,信号编码改成了PAM3,NRZ/PAM2每周期提供1位的数据传输,PAM4每周期提供2位的数据传输,而PAM3每两个周期的数据传输为3位。说人话就是,新的编码机制可以使杂讯失真比减小,信号品质更清晰,同时还能带来更高的显存运行频率以及更低的电压,根据NVIDIA的介绍,使用GDDR7显存后,数据传输速率可达GDDR6时的2倍,并且功耗接近GDDR6的一半,经典加量还减价。

神经网络着色器

接着我们再细说一下这一代架构的最大变化,NVIDIA这次将Blackwell架构的SM单元直接称为神经网络着色器。相比较于之前的可编程着色、CUDA统一着色、通用计算着色来说,其最大的变化就是引入了AI,AI将会彻底改变GPU的着色方式。

在Blackwell架构中,NVIDIA 进一步拓展了神经网络渲染的范畴,引入了诸多创新元素,包括神经网络纹理压缩(Neural Textures)、神经网络材质(Neural Materials)、神经网络体积(Neural Volumes)、神经网络辐射场(Neural Radiance Fields)以及神经网络辐射缓存(Neural Radiance Cache)等,这些元素共同构成了神经网络渲染中神经网络着色的重要呈现方式。

这里举个例子让大家能够更简单地理解神经网络渲染,过去复杂的物品或大量异材质的贴图往往会占用相当大的内存空间,如果叠加光追的话,计算量将会更大。然而,得益于神经网络渲染技术中的神经网络材质功能,这一问题得到了显著改善。开发者可以先在离线渲染出物品的光照数据,然后再用这些数据训练一个小的AI模型,游戏运行时只要实时调用这个AI模型当场推理就好了,这样就能还原出想要的光照效果了,再配合神经网络纹理压缩技术,就能显著降低实际生成的材质数据量,从而在占用更少显示内存的同时,实现了细节更丰富的材质表现,达到了实时生成如电影般细腻素材的效果。

目前神经网络渲染技术已经得到了微软的大力支持,未来也将会加入DirectX中,玩家能够体验到更真实的游戏世界。

而在硬件层面,由于神经网络渲染的加入,Blackwell架构的SM单元相较于RTX 40系的Ada架构还是有不小变化的,Ada架构内的SM内,SM单元会拆分成一半的CUDA专门用于处理FP 32(单精度浮点数),另一半则依需求动态调整去处理FP32和INT32(32位整数)。而在Blackwell架构上,SM单元则改成了CUDA核心可以完全依需求动态处理FP32和INT32的形式。

另外一个改进是,过往的着色工作往往只有SM单元的Shader在处理,而Blackwell架构上引入了神经网络渲染以后,使得Blackwell架构上的第五代Tensor核心也能共同分担着色工作,大大提高了着色效率。

这样改进的好处是,Blackwell架构能够进一步针对神经网络渲染工作进行排序,即把传统的着色工作分配给Shader,而需要动用神经网络渲染的工作负载则可以给到Tensor核心上,两种核心同时运用,效率最高可以提升2倍之多。并且得益于Tensor核心也加入了可编程渲染管线,现在开发者或API也能更好地调用Tensor核心,未来游戏内我们能见到的AI技术势必越来越多。

先进的AI管理处理器

此外,AI的应用也越来越多,不仅游戏中应用AI技术,现在连可编程渲染的过程里也引入了AI,因此如何去分配显卡内部多样化工作就成了一个问题。如过往显卡在开启DLSS玩游戏时,其中应用到的语言模型和游戏引擎需要同时与GPU的不同核心交互,生成游戏帧,但是往往很难做到每一帧都有一致的生成时间,抑或者是游戏AI对话的响应不够及时,这些情况都会造成游戏体验不友好。

而Blackwell架构为了解决这一问题,引入了AI管理处理器(AMP)。它能够实时调度资源,确保在神经网络渲染、帧生成和 AI 驱动的游戏交互中实现智能化的任务分配。这种设计不仅带来了更高效的性能输出,还让显卡在游戏渲染和 AI 运算之间实现了绝佳的平衡,确保帧的间隔均匀,对话类型的AI能够及时响应,玩家的游戏体验一致性能够比较好地保障。

技嘉GeForce RTX 5080 GAMING OC 魔鹰 16G显卡,产品介绍:

作为NVIDIA显卡的核心合作伙伴,技嘉首批上市的RTX 5080产品共有五款,包括:旗舰产品(AORUS GeForce RTX™ 5080 MASTER ICE 16G与AORUS GeForce RTX™ 5080 MASTER 16G)、SFF-RAEDY产品(GeForce RTX™ 5080 AERO OC SFF 16G与GeForce RTX™ 5080 WINDFORCE OC SFF),以及本文的测试对象——GeForce RTX 5080 GAMING OC 魔鹰 16G。

除了遵循NVIDIA的外封设计规范,显卡的外包装还融入了技嘉GAMING系列产品的独特设计元素。中央位置印有极具机械质感的“G”字,以及隐约可见的“GAMING”字样,既提升了视觉冲击力,又强调了技嘉GAMING系列产品“追求卓越”的品牌调性。

外包装背面是技嘉RTX 5080魔鹰显卡的几大亮点:风之力散热系统、RGB幻彩光轮、金属背板加固结构、仿生风扇设计、大型均热板,以及背部穿透镂空散热等。

原厂OC设定、16GB大容量显存、风之力散热,以及4年有限保修(需网上注册)

在使用技嘉RTX 5080魔鹰显卡之前,务必撕掉其保护封条以及背部金属部分的透明保护膜。

从外观设计来看,新一代的RTX 50系列技嘉GAMING产品显著增强了“G”元素的运用。这不仅体现在风扇中心的贴纸上,显卡右上角也特意加入了GAMING的“G”标识,从而提升了产品的辨识度和美观度。同时,这也满足了年轻用户对个性化需求的追求。

技嘉RTX 5080魔鹰显卡整体设计摆脱了上代RTX 40系列GAMING产品中的“圆弧”的设计,两侧的金属角处理让整块显卡更显硬朗,配上丰富的直角线条、凹槽以及三把大型风扇的搭配,营造出一种强化型机甲金属的风格,更具个性,更显张扬。

风之力散热系统无疑是技嘉RTX 5080魔鹰显卡的一大亮点。此次,该散热系统融合了多项尖端技术,包括新一代导热垫、仿生风扇配合正逆转功能、超导热管设计、大面积均热板、风扇启停功能以及进气格栅等,共同为显卡提供了卓越的散热性能。

风扇叶片采用了新一代仿生风扇,其叶片设计汲取了鹰翼的空气动力学原理,显著减少了风阻和噪声;在保持低噪音水平的同时,风压可提升至53.6%,风量增加12.5%。

为了降低相邻风扇之间的相互干扰,技嘉RTX 5080魔鹰显卡配备了三把采用正反转设计的风扇,其中央风扇的旋转方向与两侧风扇相反。此外,这三把风扇均支持智能启停技术,在负载较低时能够自动停止转动,从而实现近乎无声的运行体验。

凹槽形成一个机构散热孔即时感

GAMING无处不在

显卡肩上的金属质感拉满

同时,技嘉RTX 5080魔鹰显卡的背面延续了尾部的贯穿式通风设计,拥有大面积的开孔,使得风扇可以直接吹透散热器主体,从而增强散热效果。

背部的金属板起到加强和保护显卡的作用,防止显卡PCB长期受力而发生形变。

显卡的供电接口经过内收设计,有效防止了因接口过高导致无法安装侧板的问题,从而提升了显卡安装的兼容性。此外,供电接口还配备了独立的LED指示灯,当供电连接未完成时,LED灯会亮起以示警示,帮助防止意外情况的发生。

随显卡附着的3*8Pin转12VHPWR供电转换线

PCIe Gen5金属插槽

技嘉RTX 5080魔鹰显卡配备了3个DP 2.1b接口和1个HDMI 2.1b接口,能够轻松支持4K 480Hz和8K 165Hz的超高分辨率与刷新率,甚至能够满足多屏高分辨率和高刷新率的配置需求,迎合了不同玩家的喜好。

关于拆解过程,由于某些特定原因,我们无法在此展示。然而,根据技嘉官方提供的数据,这款散热器采用了大面积散热片、均热板以及多热管的复合式散热设计。GPU直接与均热板相连,而显存和供电模块则通过新一代导热垫进行辅助散热。

装机展示

采用顶部滑动式侧板设计,并嵌入GIGABYTE LOGO,底部设有ARGB灯效区域。

三环RGB灯效

侧装效果依旧令人满意,尤其方便的是反装12VPWR接口,轻松实现供电接口的连接与拆卸。

测试平台介绍:

开始性能测试前介绍一下本次的测试平台, CPU使用的是目前毫无争议的游戏神U——AMD Ryzen R7-9800X3D。

主板则是同样来自技嘉的X870 AORUS ELITE WIFI7小雕主板,刷新到最新版本BIOS的同时,在BIOS中开启X3D模式,以便获得更好的性能表现。

而内存,我们这次选用的是24G×2套条的T-FORCE XTREEM ARGB 幻镜DDR5内存,在这块主板上直接开启AMD EXPO即能轻松达成DDR5-8000 C38的成绩,确保这张显卡能够释放全部性能。

技嘉智能管家(GCC)介绍

从技嘉官网下载并安装GCC之后即可以正确识别出X870 AORUS ELITE WIFI7小雕主板与 GeForce RTX 5080 GAMING OC 16G 魔鹰显卡,还能控制整机RGB灯效。

技嘉RTX 5080魔鹰显卡自带风扇启停技术,可以自定义风扇转速,以及关闭风扇启停。

至于性能页面更是可以对技嘉RTX 5080魔鹰显卡进行核心Boost频率、GPU电压、电源上限、温度上限,以及显存频率的设定,方便大家对显卡进行超频。当然普通玩家更是可以通过OC Scanner扫描进行自动超频,以及获得更好的显卡性能表现。

理论性能测试

在测试环节,我们首先关注3DMARK的理论性能指标。在FireStrike系列测试中,技嘉RTX 5080魔鹰显卡的表现引人注目,其性能超出RTX 4080 SUPER约27%,与RTX 4080相比,领先优势更是扩大至35%。在以DX12为基准的Time Spy测试中,技嘉RTX 5080魔鹰显卡的得分为33526,相较于RTX 4080 SUPER或RTX 4080显卡,均能保持约20%的领先优势。由此可见,性能的提升是相当显著的。

DLSS 4专项测试

看完了理论性能部分的测试,接着我们再来看看本次RTX 50系显卡最“顶”的升级,DLSS 3在RTX 40系显卡上引入了帧生成技术,能够依靠AI在两帧之间生成一帧AI帧,从而实现帧数的翻倍,用过的玩家都说好!不过由于每生成一个新的帧都需要光流加速器和 AI 模型参与,因此生成多帧的开销相当高昂,而过高的性能开销会带来瓶颈,导致帧率提升受限。

而这次DLSS 4全新升级,引入了多帧生成技术,它可以利用 AI 为每个渲染帧额外生成多达3帧!相比传统渲染的方式,能够最多实现8倍的性能提升。并且每次渲染额外帧只需要帧生成AI模型执行一次,就能输出三帧画面,因此无论是对性能、显存的开销还是延迟都比之前要好了许多。

另外,由于多帧生成技术,输出的帧多了,要给每一帧都安排一个合理的间隔刷新才能让观感更好。因此NVIDIA还引入了专属的Flip Metering来代替CPU Pacing,它将帧节奏逻辑转移到显示引擎,让GPU能够更精确地管理显示时间,尽可能地将每一帧画面的生成时间保持一致,从而提高整体游戏视觉的流畅感。不过由于Flip Metering是硬件级的控制器,因此DLSS 4的多帧生成目前只有RTX 50系显卡支持。

同时DLSS 4 还引入了图形行业首个 Transformer 模型实时应用。熟悉AI的应该对它很熟悉了,它在AI生成领域已经应用多年了。基于Transformer架构的 DLSS 超分辨率和光线重建模型,相比之前DLSS使用的卷积神经网络(CNN)模型来说,具备2倍的参数量和4倍的计算量。在游戏场景中,能够提供更高的稳定性、更少的拖影、更高的细节和更强的抗锯齿能力,使画面更加清晰、流畅和逼真。

不过虽然DLSS 4的多帧生成功能是RTX 50系显卡的独占功能,但新的Transformer模型将适用于所有GeForce RTX显卡。并且根据NVIDIA的说法,超过75款游戏和应用将在GeForce RTX 50系列开售时支持DLSS 4的全新DLSS多帧生成功能,包括《赛博朋克2077》《战神:诸神黄昏》《心灵杀手2》《霍格沃兹之遗》等,《黑神话:悟空》也将于今年晚些时候升级支持 DLSS4的多帧生成。随着时间的推移,支持DLSS 4的游戏和应用数量将不断增加。

简单介绍完,我们再看看DLSS 4的理论表现如何,还是经典的3DMark测试。不得不说技嘉RTX 5080魔鹰显卡搭配上DLSS 4有如神助,帧数再度实现了飞跃!

其中2K分辨率下,开关前后性能差距足足有4倍有多,4K分辨率就更夸张了,开关帧数差距得有6倍,即便是对比DLSS 3的话,帧数也能提升69%,接近翻倍的体验了。最离谱的还要数8K,要知道RTX 40时代,次旗舰显卡玩8K游戏是在玩PPT的状态,而现在技嘉RTX 5080魔鹰显卡可以做到156 FPS,很是流畅了。

《霍格沃兹之遗》

经过体验,《霍格沃兹之遗》这款游戏的优化表现相当出色。在4K分辨率和光线追踪均调至最高设置的情况下,使用技嘉RTX 5080魔鹰显卡,即便不启用任何超采样技术,平均帧率也能达到79 FPS,确保了游戏的流畅运行。当启用DLSS 3性能模式后,帧率进一步提升至206 FPS,游戏体验变得异常流畅。而开启DLSS 4模式时,帧率更是惊人地达到了360 FPS,这已经远远超出了当前大多数显示器的高刷新率范围。与原生4K设置相比,性能提升了超过4.5倍。在实际游戏过程中,无论是1%最低帧率还是延迟表现都相当优秀,特别是延迟,甚至比原生分辨率下还要低,带来了更佳的操控感。

《星球大战》

第二款游戏我们测试的是《星球大战》,一样你能在设置中看到其帧生成功能已经支持×4的选项,也就是DLSS 4多帧生成功能。不过这项功能是RTX 50系独占,想要体验最强的游戏性能,那就赶紧升级最新的技嘉RTX 5080魔鹰显卡!

在这款游戏中,DLSS 4的实际效果令人印象深刻。在4K原生分辨率下,技嘉RTX 5080魔鹰显卡的平均帧率仅为20 FPS,延迟也高得令人担忧。然而,当启用DLSS 4性能模式后,游戏的平均帧率飙升至173 FPS,游戏体验瞬间变得如丝般顺滑。与原生4K相比,性能提升了大约8.5倍。即便是与DLSS 3的97 FPS相比,性能也几乎翻了一番,这确实是一个令人满意的性能提升。

《赛博朋克2077》

下一款游戏则是有“显卡杀手”之称的《赛博朋克2077》,有一说一,《赛博朋克2077》的设置页面就更丰富,除了能够设置DLSS 4的多帧生成外,还可以切换DLSS 4的另一个特性——Transfomer Mode,据说能够让画质更清晰,同时还能解决此前的拖影问题,对玩家可以说是一大利好。

接下来,让我们深入了解DLSS 4的性能表现。作为“显卡杀手”,DLSS 4对显卡的挑战确实非同小可。在最高画质与路径追踪的设置下,即便是性能强劲的技嘉RTX 5080魔鹰显卡,其表现也仅为19 FPS,几乎难以提供流畅的游戏体验。然而,当启用DLSS 3技术后,游戏的帧数跃升至106 FPS,流畅度显著提升。进一步开启DLSS 4,技嘉RTX 5080魔鹰显卡的表现更是惊人,达到了189 FPS,性能提升了惊人的8.9倍。更令人印象深刻的是,1%Low的帧数几乎与DLSS 3下的平均帧数持平,这意味着游戏中的掉帧现象极为罕见,整体稳定性极高。

《漫威争锋》

如果你想玩的游戏还不支持DLSS 4,那也不用担心,NVIDIA App还提供DLSS 4 Override功能,说人话就是能够让游戏强开DLSS 4,这里我们以《漫威争锋》为例,在NVIDIA App中简单设置,就能将帧生成调至“4X”,一键实现多帧生成。

经过实际测试,启用多帧生成功能确实带来了显著的性能提升。技嘉RTX 5080魔鹰显卡在4K全高设置下,未启用超分辨率技术时,帧率仅为76 FPS,勉强能够流畅运行游戏。然而,当开启DLSS 3技术后,帧率飙升至190 FPS,相较于原生分辨率,性能提升了超过一倍。若进一步启用DLSS 4多帧生成技术,性能提升更是惊人,达到了原生分辨率的4倍以上,实现了332 FPS的惊人帧率,轻松步入电竞级3A游戏体验。此外,延迟表现同样卓越,原生分辨率下的延迟为26ms,而启用DLSS 4后,延迟进一步降低至23ms,使得游戏响应更加迅速,玩家体验更加流畅。

总的来说,DLSS 4多帧生成功能的出现,毫无疑问让玩家的游戏体验又上了一个台阶。对比上代RTX 40系的DLSS 3帧生成功能,再度实现了帧数的飞跃。同样的画质设置,RTX 5080的表现遥遥领先于RTX 4080,实测在上面提到的四款游戏中,开启DLSS 4的GeForce RTX 5080,帧数几乎是RTX 4080的翻倍!并且这还不是靠硬件的提升,全靠“科技与狠活”!

另外,值得一提的是,与DLSS 4一起到来的还有全新的NVIDIA Reflex 2技术。延迟一直是电竞中绕不开的话题,玩家的每个动作都会经过复杂的计算,再在屏幕上渲染,其中的每一步都会增加延迟。虽然延迟往往只有几十毫秒,但是你却能明显地感觉到游戏的不流畅、卡顿。

为了尽可能地降低延迟所带来的不良游戏体验,NVIDIA发布了NVIDIA Reflex技术,它可以使GPU和CPU同步,确保最佳响应速度和低系统延迟。目前NVIDIA Reflex已集成到超过100款游戏中,可以将PC延迟降低50%。

而GeForce RTX 50系显卡再度升级,带来了NVIDIA Reflex 2技术。它结合了Reflex低延迟模式与Frame Warp技术。它可以把最新的鼠标输入指令同步给渲染帧,及时更新渲染的游戏帧并在渲染帧被发送到显示器之前获取最新的鼠标信息,通过刷新渲染的游戏帧以进一步减少延迟,将PC延迟进一步降低多达75%。

另外,Frame Warp的加入,能够进一步将延迟降低。当一个帧被GPU渲染时,CPU会根据最新鼠标或手柄输入计算工作流中下一帧的视角位置。Frame Warp从CPU采样新的视角位置,然后将GPU刚才渲染的帧扭转到最新的视角位置。在渲染帧被发送到显示器之前,在尽可能最短的时间进行扭转操作,确保屏幕上反映最新鼠标输入。

而当Frame Warp转移游戏像素时,图像中可能会产生缝隙撕裂、镜头位置的变化会让游戏场景中显示新的部分。NVIDIA则开发了一种优化了延迟的预测渲染算法,该算法使用来自先前帧的视角、颜色和深度数据,对这些撕裂空白的像素进行准确的图像修复。玩家可以通过更新的视角看到没有撕裂的渲染帧,并降低了改变游戏内视角位置而产生的延迟。说人话就是现在NVIDIA Reflex 2还可以根据上一帧的信息去脑补一些空白的像素,有种无中生有但你又看不出来的感觉。

首发支持NVIDIA Reflex 2技术的游戏是《THE FINALS》以及《无畏契约》,后续我们也会第一时间带给大家该技术的详细评测。

游戏性能测试

在见识了DLSS 4的卓越性能之后,我们接下来将目光转向传统游戏性能的评估。一如既往,我们首先进行3DMark的DLSS 3性能测试。技嘉RTX 5080魔鹰显卡在2K分辨率下的性能相较于RTX 4080或RTX 4080 SUPER提升了约29%,而在4K分辨率下,启用DLSS 3后,性能优势也大致保持在29%的水平。考虑到这三款显卡在CUDA核心数量上的微小差异,我们不得不对Blackwell架构的强大性能表示赞叹。

当然理论性能终归是纸上谈兵,还得进游戏里实际测试一下才知道技嘉RTX 5080魔鹰显卡的实力。这里我们选取了11款游戏进行测试,包含光追及光栅性能方面的测试,而游戏画质方面均全部选择最高画质,光追设定部分,如有则采用最高。

在实际测试中,技嘉RTX 5080魔鹰显卡在4K分辨率下轻松应对了大多数游戏,尤其是在DLSS技术的加持下,实现4K@144Hz的电竞体验毫无压力。即便是将《黑神话:悟空》的设置调至全高,这款显卡仍能提供87 FPS的流畅体验,几乎触及了高刷新率的极限。可以预见,随着DLSS技术的进一步升级,帧数的提升将更为显著。在性能对比方面,技嘉RTX 5080魔鹰显卡在众多游戏中表现出色,相较于RTX 4080 SUPER,其性能大约高出20%,而与RTX 4080相比,性能领先幅度更是可以达到25%以上。

图像视频创作性能测试

游戏测试完成后,接下来让我们关注创作者们所关心的生产力性能。在PCMark10 Extended测试中,技嘉RTX 5080魔鹰显卡在游戏和数字内容创作方面的表现更为出色,相较于RTX 4080,其性能提升了大约7%和12%。然而,在生产力测试方面,成绩略显逊色,这可能是因为当前驱动程序尚未完全优化。

办公软件测试中,技嘉RTX 5080魔鹰显卡表现也不错,整体性能可以领先4%左右,其主要领先在Excel、PPT以及Outlook三项,不过有一说一,这三张卡用来办公只能说确实有些浪费了,用它们打开这些软件,差距应该都是微乎其微的。

在Adobe以及达芬奇的Benchmark测试里,GeForce RTX 5080整体相比RTX 4080或RTX 4080 SUPER也有小幅提升,不过提升比较大的还是视频编辑部分,究其原因还是因为这一代RTX 5080再度对编码器进行了升级,不仅编解码的效率更高,同时支持的格式也更丰富。

例如在达芬奇和PR的测试中,技嘉RTX 5080魔鹰显卡领先RTX 4080约7%~17%,还是非常夸张的。同时在PS以及AE里也有小幅的性能提升,大约在4%~12%之间,总体来说就是内容创作的效率更高了。

3D渲染创作性能测试

看完了图像视频方面的创作,我们再把目光投向3D渲染以及工业领域的软件中,看看RTX 50系显卡又有怎样的精彩表现。还是熟悉的朋友Blender以及V-Ray,在这两款软件中,技嘉RTX 5080魔鹰显卡的表现也是大杀四方,其中前者基本上能领先RTX 4080 SUPER达5%~12%,而后者就夸张了,对比两张40系卡,甚至可以领先至86%。

再看看另外一款渲染器,D5 Render是一款基于DXR和光线追踪技术构建的GPU渲染器。正因为其有光线追踪技术,其渲染的画面相当出色。这款软件在RTX 40系显卡测试时支持了DLSS 3帧生成,而现在随着RTX 50系显卡的发布,它也可以通过NVIDIA App的方式支持最新的DLSS 4多帧生成功能。

实测技嘉RTX 5080魔鹰显卡在开启DLSS 4以后,整个渲染预览的界面变得丝滑流畅,帧数基本在226 FPS附近,而对比不开DLSS时,仅59 FPS的表现来看,性能几乎是提升了4倍以上。即便是面对RTX 40系的DLSS 3,也一点不虚,性能优势也有50%以上。

再看看工业领域的表现,SPEC2020能够反映显卡的工业能力,在多项测试中技嘉RTX 5080魔鹰显卡依旧傲视群雄,对比RTX 4080平均有30%的提升,而对比RTX 4080 SUPER也在25%左右,这个性能提升还是很可观的,甚至有些超乎想象。

NVIDIA编解码测试

接下来的测试则是介绍RTX 50系显卡的编解码器,GeForce RTX 50系列显卡上换装了第9代NVENC编码器与第6代NVDEC解码器,在视频规格上支持AV1 UHQ(超高画质 AV1)与MV-HEVC(多视角HEVC)编解码。同时由于GeForce RTX 50系列显卡还升级支持DisplayPort 2.1 UHBR20输出,单一通道支持20Gbps带宽,因此用户可以体验到令人惊叹的HDR视觉效果、超高分辨率和更流畅的游戏体验。

这里我们直接使用NVIDIA提供的4K60片源与工程文件分别测试AV1、H.265以及H.264下的编码导出时间。实测同一段素材下,GeForce RTX 5080导出三段视频的时间分别是9秒、10秒以及13秒,效率分别比RTX 4080或RTX 4080 SUPER快了111%、90%以及54%。

同时,我们也对导出的不同格式的视频进行了画质对比,实测AV1编码的视频在画质上与H.265或H.264也没有明显差距,无论是在文字、人像还是建筑等画面里,三者的画质可以说是伯仲之间,如果不特地标注其格式,一般人很难用肉眼分辨出来。随着目前越来越多视频网站、剪辑软件和硬件厂商的推动,未来AV1势必会成为下一个最受欢迎的格式。

值得一提的是,GeForce RTX 50系显卡还能够支持4:2:2色度取样的视频编解码,这将节省CPU的负担,加快创作速度。上面的图表里也可以看到我们的测试成绩,实测导出时间会比上代显卡快不少,毕竟RTX 40系显卡不支持该功能,仅支持4:2:0色度采样,如果一定要4:2:2导出只能靠CPU软解。

4:2:2色度采样的视频文件采用的是YUV颜色格式,与存储红色、绿色和蓝色(RGB)值不同,颜色被存储为亮度Y、蓝差色度U和红差色度V。在这类视频中,视频的完整亮度将被保留,而原始色度信息只保留一半,因此相比4:4:4的视频,其视频帧数据量仅有不到三分之二,而相比4:2:0的视频又能提供两倍的颜色分辨率,因此创作者采用这种格式拍摄,能够在保留更多色彩信息的同时还能减少文件大小和带宽需求。

AI性能测试

AI是老黄在CES上谈及的重点,而RTX 50系显卡上针对AI性能的改进则是加入了对FP4精度模型加速处理的支持,它相比此前RTX 40系上的FP8精度,能够实现更快的生成速度,同时显存占用也更低。

不信你看,我们用UL Procyon的FLUX.1 AI Image Generation Demo For NVIDIA进行测试。在均使用FP8精度模型时,技嘉RTX 5080魔鹰显卡能够做到13.705s生成一张图,而RTX 4080或RTX 4080 SUPER则要17秒以上;而切换到FP4精度模型后,速度才真正拉开了差距,其中技嘉RTX 5080魔鹰显卡生成图片的速度能够提升到6.742秒一张,效率翻了一倍不止。而RTX 4080或RTX 4080 SUPER的生成时间则不降反升,RTX 5080对比它们的性能,拉大到了3.5倍以上。

并且FP4精度模型生成的图片也非常能打,从下图就能看出来,其与FP8生成的图片几乎没有区别,无论是对关键词的理解还是图像的质量,都非常有保障,新时代AIGC玩家的最佳选择了。

再看看GeForce RTX 5080在Stable Diffusion中的表现如何,还是用UL Procyon进行测试,在比较轻松的SD 1.5文生图测试里,无论是采用FP16精度模型还是INT8精度模型,RTX 5080的表现都展现了旗舰级显卡应有的实力,特别是在INT8精度下,生成一张图的速度仅需0.54秒,效率比上代显卡快了48%,已经接近一倍了。而即便是在压力比较大的SDXL中,优势也非常明显,生成一张图的速度为8.439秒,同样领先RTX 4080或RTX 4080 SUPER达1~2秒。

在AI文本生成测试中,技嘉RTX 5080魔鹰显卡在一众大语言模型里同样表现出众,我们用MLPerf Client v0.5大语言模型进行测试,它是基于meta的Llama 2 7B开源LLM打造,涵盖了四项AI任务,分别是内容生成、创意写作以及对两份不同长度文本进行总结摘要。实测技嘉RTX 5080魔鹰显卡在每一项中都表现出了绝对的统治力,各项领先幅度均在17%~19%左右。

接着我们又用UL Procyon的AI Text Generation测试了更多的大语言模型,技嘉RTX 5080魔鹰显卡的优势依旧十分明显,在以Llama 3.1 7B LLM打造的Phi-3.5测试中,新一代显卡取得4550分的成绩,相比RTX 4080提升了17%,相比RTX 4080 SUPER则提升了7%;将参数扩大至Llama 2 13B的测试中,技嘉RTX 5080魔鹰显卡的表现更加亮眼,4831分的表现已经离RTX 4090不远了,对比性能的话,则可以领先RTX 4080约29%,领先RTX 4080 SUPER 23%以上。

功耗与温度表现

最后一项测试烤机,这也是许多玩家关注的重点,毕竟双槽卡的厚度但是塞下了360W的核心,不免让人担心它的温度表现。不过实测Furmark烧机10分钟后,得益于技嘉RTX 5080魔鹰显卡出色的风之力散热系统,核心温度并不高,仅有63.1度,显存温度也是58度,此时显卡的最大功率为359.98 W,已经完全顶着TDP的上限了,风扇转速则是1647RPM,噪声还真的少。

横向对比RTX 4080或RTX 4080 SUPER时可以看到,虽然技嘉RTX 5080魔鹰显卡的TDP提升了,不过整体的烤机功耗并不算高,同时双槽卡在减低了厚度的情况下,核心与显存的温度控制确实不错,属于是非常惊喜了。这对ITX玩家可以说是一大喜讯,现在小主机也能有强性能!

评测总结

对于追求极致游戏体验的高端玩家来说,技嘉RTX 5080魔鹰显卡无疑是一个不错的选择,目前售价8299元。它能够在高分辨率、高画质下畅玩各种 3A 大作,为玩家带来沉浸式的游戏感受。对于从事创意设计工作的专业人士,如视频编辑、3D 建模师等,这款显卡强大的图形处理能力和加速性能,能够显著提高工作效率,为创作提供更多的可能性。

无论是游戏实测还是创意设计工作中的表现都可圈可点,技嘉RTX 5080魔鹰显卡能够满足大多数玩家和创作者对高性能显卡的需求。独特的风之力散热设计有效控制了显卡温度,保证了显卡在高负载下的稳定运行,智能启停技术和 RGB 灯效也为用户带来了更好的使用体验和个性化选择。

然而,这款显卡也并非完美无缺,较大的体积可能会给一些小型机箱用户带来安装难题。对此技嘉也推出了符合SFF-RAEDY的产品(GeForce RTX™ 5080 AERO OC SFF 16G与GeForce RTX™ 5080 WINDFORCE OC SFF),这样就不担心安装问题了。

来源:太平洋电脑网

相关推荐