摘要:月初英特尔公布锐炫Battlemage(战斗法师)B580/B570显卡之后,我们也同步进入到了新品的评测环节。目前B580已经在电商平台开售,而规格略低一些的B570将在明年1月份上架,所以这次首测,我们主要来看看英特尔锐炫B580的表现。
月初英特尔公布锐炫Battlemage(战斗法师)B580/B570显卡之后,我们也同步进入到了新品的评测环节。目前B580已经在电商平台开售,而规格略低一些的B570将在明年1月份上架,所以这次首测,我们主要来看看英特尔锐炫B580的表现。
作为英特尔锐炫品牌下的第二代桌面级显卡,B系列深受用户期待。而作为B系列最先吹响冲锋号的锐炫B580是否能够交出一份令人满意的答卷,对于英特尔显卡未来的发展也有着举足轻重的作用。这里我想先做一个剧透,用一句话形容锐炫B580就是:下限高于RTX 4060,上限RTX 4060Ti互有胜负,且价格低于RTX 4060。算得上是物美价廉的一款产品了。
下面就让我们从架构技术入手,逐步揭开英特尔第二代锐炫显卡的面纱。它的性能如何?光追是否有显著提升?与竞品对比又有怎样的性能表现?通过本篇评测您将看到这些问题的答案。
·架构解析
首先我们需要明确一个定位:锐炫A系列是为1080p游戏而生,而锐炫B系列就是为2K甚至4K环境下的高画质游戏体验而设计,这意味着它的性能必须要经得起考验。
先来看看锐炫B580的规格:它拥有5个渲染切片,集成核心,配备20个光追单元,160个XMX AI引擎,默认频率2670MHz,配备12GB显存,192bit位宽,带宽速率456GB/s,INT8峰值算力233TOPS,总TBP为190W。支持PCIe4.0 x8,支持AV1等主流编解码,配备3个DP2.1和1个HDMI2.1视频端口。三个DP口中,最中间的可以输出完美的4K@360Hz画面。架构层面,英特尔对直接影响性能的Xe核心和光追单元进行了增强。前者体现在新的矢量引擎中,除了继续支持原生SIMD 16计算,还增加了对SIMD 32的支持。虽然不是原生支持,但已经能够执行SMID 32指令。
而后者的变化相对更大:traversal pipeline的数量提升到3个;box intersections增加到18个;triangle intersections增加到2个,并且扩展了BVH(层次包围体结构)缓存,从而极大地提高了光追单元的速度和效率。
接下来的这张图是锐炫B系列GPU的SoC架构设计示意图,代号BMG-G21。从这张图上可以看到包括Render Slice(渲染切片)、Media Engine(媒体引擎)、Memory Fabric(显存总线)、Display Engine(显示引擎)、Copy Engine(复制引擎)、Memory Controller(显存控制器)等在内的各个计算单元、I/O单元的详细构成。
这里我们主要来看看Render Slice(渲染切片),因为它是锐炫GPU最为核心的部分,第二代锐炫GPU的各项提升也都来自这里。
e核心以及4个光追单元。锐炫B580拥有5个渲染切片,因此就包含了20个Xe核心以及20个光追单元。核心拥有8个XMX AI矩阵引擎,那么锐炫B580自然就是有160个XMX AI矩阵引擎。XVE(矢量引擎)取代了X-LP架构时代的EU(执行单元)。这里需要做一些解释:XVE和以往的EU(执行单元)都是Xe架构里最小的线程级单元,二者概念上相同,只是在具体实现上有一定差别,不过这一点无需深究。前面所说的Xe此外,渲染切片还包含了10个Pixel Backends(像素后端)和20个Texture Samplers(纹理采样器)。第二代Xe核心还新增了256KB的共享L1/SLM(共享本地内存)。很多朋友可能会想要了解英特尔的这些单位与N卡对应的话该如何换算。其实以B580的5个渲染切片配置来说,对应的就是80个ROPs和160个TMUs,因为纹理采样器转换为TMUs的比为8:1,所以8×20就等于160个TMUs;同理,像素后端对应N卡的ROPs,8×10也就是80个ROPs。这部分大家有兴趣的话了解一下即可,对普通用户来说不重要。
核心、光追单元升级,显现到“前台”的就是在效率上的显著提升。如果与第一代英特尔锐炫GPU,即锐炫A系列相比的话,B系列现在其实架构层面的变化与带来的性能升级就是这些了,但这并非是锐炫B系列性能提升的唯一途径,因为SS 2技术的加持,其在最终游戏里的表现会进一步升级。当然单从理论上去做说明,很难get到这些变化对于实际性能的影响究竟如何?所以接下来让我们正式进入首测,通过测试数据全面了解英特尔锐炫B580的性能表现。·开箱
首先我们做一个简单的开箱,这里就不多做介绍了,毕竟大家后续要购买锐炫B580的话,很多人还是愿意选择规格更高的非公产品。
·外观介绍
公版锐炫B580显卡依旧采用了与锐炫A系列显卡相仿的类肤漆材质,所以风扇模组这一面的触感非常细腻。但是类肤漆材质易留手印的问题还是存在,好在显卡这种设备也就是在第一次安装时会触摸一下,没有谁会天天打开机箱盘一遍。
公版显卡采用了双风扇设计,毕竟它的TBP总体只有190W,我在实际测试中也观察了游戏时的峰值功耗,《黑神话:悟空》这种几乎全部负载都在显卡上的游戏,平均功耗也不过就是95W左右,双风扇设计足够了。这样使得卡体更加小巧,能够适配不同规格的机箱。
卡体背面设计颇为独特,一半是散热鳍片加通风口的开放式设计,另一半对PCB起到保护作用。面板上印有「Intel ARC B580」产品品牌与型号标识,并且设计有与包装盒一样的弧形点状装饰纹理。
半开放式的背板设计加上双风扇,确保了公版锐炫B580拥有出色的散热表现。
卡体顶部也设计了合理的空间露出鳍片,靠左侧位置设计有白色的intel ARC背光灯,中间位置设计了8-Pin电源插孔。
接口方面,公版锐炫B580配备了3个DP2.1和1个HDMI2.1a视频端口。
这里需要注意的是,中间的主DP接口可以支持7680×4320@60 Hz、7680×2160@165Hz、5120×2880@240Hz、5120×1440@360Hz以及3840×2160@360Hz画面输出,而左右两侧的DP接口支持7680×4320@60Hz、7680×2160@165Hz、5120×2160@240Hz、3840×2160@240Hz画面输出。
·测试平台简介
基于产品定位来看,锐炫B580很可能是锐炫B系列的中端显卡,毕竟按照第一代产品命名方式,上面应该还有锐炫B7系列的产品。所以这次测试也采用了与之定位适配的中端配置方案。处理器上选用了英特尔酷睿i7-14790F,内存为英睿达2×32GB DDR5 6000,其它配置、系统/驱动版本以及BIOS设定请参看下图:
·3DMark理论性能
锐炫A系列显卡的3DMark理论成绩很强,但实际游戏性能与跑分不太匹配。这次锐炫B580的3DMark理论成绩依旧很强,普遍高于RTX 4060Ti,而实际游戏性能也基本与之匹配,这是锐炫B系列显卡最显著的进步。后面的游戏测试部分相信大家会感受到这一点。
老规矩,我们先来看看3DMark各项理论测试成绩,具体如下:
相对锐炫A770而言,锐炫B580性能可以说是全方位大幅提升,光追性能达到了7903分,A770为6974分,考虑到锐炫A770理论与实际性能之间差异比较大,所以二者光追性能实际上的差异要比跑分来的更大。另外在DX11和DX12性能层面,锐炫B580提升也都非常显著。下面附上锐炫A770/A750首发时的3DMark性能测试数据以供参考:
总体而言,锐炫B580理论性能层面有两大亮点:
其一,整体跑分表现依旧很好,理论性能比公版RTX 4060Ti还要略高一些,且远超公版RTX 4060,这个我们会在后面的竞品对比环节放出。
其二,锐炫B580的光追性能相较锐炫A系列显卡而言提升巨大。而且大家不用担心,后面的游戏实测也可以看到,锐炫B580的理论成绩与实际性能基本匹配,可以说是货真价实的性能提升。
·AI理论性能
其实相对于游戏而言,英特尔显卡在AI和视频编解码方面有着更加出色的性能表现,基本能够跻身一流行列。只是大家在评判显卡产品性能时,更习惯去以游戏体验作为标准。得益于12GB显存容量,锐炫B580的AI算力也是相当不错,Geekbench AI单精度、半精度、量化测试可以看到,B580分别能够获得11882、26613、27792分的成绩,用于本地化的AI计算没有任何问题。
另外别忘了,英特尔针对AI其实还提供了Intel OpenVINO加速,这也是属于I卡的“CUDA”了。UL Procyon GPU OpenVINO整数和浮点性能测试,锐炫B580得分达到了2584和1894分,AI算力方面基本能够满足用户使用层面的需求。当然如果是用来做训练端的算力输出,那么单卡锐炫B580可能会有些吃力。
·常规游戏性能
对于大多数用户来说,实际游戏表现肯定是最关注的因素,那么锐炫B580实际游戏体验究竟如何呢?这次测试我们总计选择了20多款不同类型的游戏,最终根据测得的平均帧将游戏划分为硬件要求较高的大型3A游戏,以及硬件性能要求较低的普通3A游戏和电竞游戏。下面我们来看看这些游戏测测试结果。
在大型3A游戏方面,锐炫B580的表现超出预期,即便是《黑神话:悟空》这样的GPU负载极重的游戏,超高画质(次高画质)2K分辨率下的平均帧可以达到43fps,4K分辨率也能站稳30fps以上,说实话对于一款2000价位的显卡来说已经是相当不错的表现了。
此外从这些游戏测试可以看到,锐炫B580相对于上一代而言,绝大部分游戏在2K分辨率下都能以最高画质设定流畅运行,帧数都超过了60fps。而4K分辨率的表现其实也不差,不少游戏跑在40-60fps之间还是没啥太大问题的,当然2K分辨率是使用锐炫B580玩大型3A游戏的舒适区。
对于电竞游戏和普通3A游戏来说,锐炫B580的性能更加游刃有余。即便是《三角洲行动》这种最新上线的画质很高的游戏,2K和4K分辨率、最高画质都能流畅运行。另外以大家熟悉的《古墓丽影:暗影》跑分为例,DX12默认开启XeSS平衡模式的情况下,最高画质4K分辨率平均帧82fps、2K分辨率平均帧137fps,完全能够满足当前主流3A游戏对硬件的性能需求。
从1080p到2K甚至4K分辨率,锐炫A系列到锐炫B系列显卡的进化放佛从过去走向了现代。加上锐炫B580的定价十分良心,应该会在销量上有更加出色的表现。而且在N、A两家新品未发售之前的这段空窗期里,锐炫B580很可能会快速抢占入门到主流级显卡的市场空间,因为它确实是一款性价比超级高的产品。而且相较锐炫A系列高分低能的表现而言,锐炫B系列的实际表现与理论性能之间的匹配度非常高,这是锐炫B系列最有价值的升级点。
·游戏光追性能
此外,使用过锐炫A系列的朋友都知道,I卡的光追性能远逊于N卡。不过前面的架构分析中我们也看到,这次锐炫B系列GPU的光追单元规格实现了全方位升级,其带来的最为显著的改善自然是光追性能提升。
参考《赛博朋克2077》这款典型的光追游戏测试可以看到,锐炫B580终于可以开启超级光追模式了,其2K分辨率+超级光追+XeSS自动设定的情况下,平均帧率达到了59.48fps,已经是非常流畅的画面表现了;而4K分辨率+超级光追+XeSS自动设定的情况下,平均帧也能够接近40fps,体验明显优于锐炫A770(2K分辨率+超级光追+XeSS自动平均帧45fps)。
从常规游戏性能测试结果来看,锐炫B580已经能够满足绝大部分用户的游戏需求,并且能够在2K甚至4K分辨率、最高或次高画质下带来流畅游戏体验。尤其是在2K分辨率上,锐炫B580可以提供足够值得信赖的游戏体验。这也意味着英特尔锐炫桌面级显卡正式从1080p全高清时代迈向2K和4K超高清时代。
时下,超采样技术对于显卡而言有着极为重要的作用,在面对高画质、光追、高分辨率这些场景时,开启超采样会让游戏帧数获得明显提升。从锐炫A系列到B系列,市面上已经有数百款主流游戏默认支持Intel XeSS支持非常不错的游戏的表现。我们在测试时使用了压力极高的4K分辨率、开启最高画质。《永劫无间》的eSS画质选项有7档,实测从超级性能到原生抗锯齿,平均帧数差异达到102%,各档之间帧数差异大概在8-13fps。最新的《三角洲行动》也支持4档Intel XeSS选项,4K分辨率、最高画质,平衡档平均帧数117fps,终极质量档平均帧数86,帧数差异36%。可见无论是老游戏还是新游戏,Intel XeSS技术都能够带来帧数上的显著提升。eeSS-LL(Low Latency)两项技术,也就是帧生成和低延迟,从技术功能层面与N卡的DLSS3.5看齐。目前已经发售的游戏里基本还没有实装Intel XeeSS 2实装后的表现到底如何,能不能像DLSS3.5那样进一步提升帧数。2K分辨率最高画质下,《F1 24》这款游戏如果不开超采样的话,平均帧数只有47fps,能玩但不流畅,毕竟竞速类游戏对画面流畅度的敏感度还是相当高的。如果SS的情况下,质量、平衡、性能、超级性能4档分辨率分别可以达到70fps、73fps、89fps和94fps。Intel XSS 2需要在游戏里开启帧生成,并切换到Intel XeSS-FG,同时在ARC控制面板里打开“显卡”子选项里的低延迟模式。之后可以看到《F1 24》的帧数会进一步提升,4档分别为109fps、111fps、115fps以及118fps,最低帧到最高帧提升了151%。·应用性能
游戏性能了解之后我们来看看生产力应用相关的性能表现。这里我们选择了专业摄影师现在越来越常用的CameraRAW AI降噪,视频用户熟悉的AV1编码,建筑领域用户使用的D5渲染器以及AI领域应用颇为广泛的Stable Diffusion四项测试。
「CameraRaw AI降噪」
CameraRAW是专业摄影师常用的照片初级调校插件,在性能项中可以选择锐炫B580作为主要的图形处理器,它对于I卡的加速支持还是相当可靠的。
这里我们选择了富士相机拍摄的102MP 14bit无损原片进行AI降噪。这项测试根据照片像素的不同,完成时间会有较大差异。之所以选择102MP 14bit无损照片,也是想看看锐炫B580的极限性能到底怎样,毕竟102MP原片的分辨率已经达到了11648×8736,而AI降噪的负载是100%放在GPU上的。
另外在测试中我们分别执行了单张和10张批处理任务,整个任务执行过程中,GPU负载持续拉满。
通过测试以及请教专业摄影师意见之后,考虑到锐炫B580显卡2000出头的定价,其性能表现可以说是物超所值,单张任务完成耗时36.12秒,10张连续任务完成耗时370秒,完全能够满足专业摄影师的需求。
另外其实笔者还测试了单张45.4MP原片的AI降噪时间,耗时约为18秒,这更加接近当前主流单反和微单的RAW格式原片规格。
「Handbrake AV1编码」
AV1编码是非常高效、高质量且经济的编码方案,现在已经被Youtube等众多流媒体平台所使用。而最早支持AV1编码的GPU,正是英特尔锐炫A系列。如今到了锐炫B系列产品上,性能的提升自然会带来编码效率的进一步提升。
我们将一段5分钟的1080p视频通过AV1 QSV编码转换为4K视频,实测耗时33秒。同样任务如果用锐炫A770来做,总耗时要达到82秒,效率提升约1.5倍。
「D5渲染器出图」
D5渲染器是当前非常好用的一款国产建筑、家装设计渲染软件,而且在引入AI技术之后,整体出图效率提升了一大截。测试时我们采用D5渲染器自带的Demo图进行输出,实测耗时为1分34秒。
「Stable Diffusion AIGC」
Stable Diffusion的Web UI是当前大家最为熟悉的AIGC应用之一,我们使用的是整合好的绘世启动器版本,它目前已经可以支持最新的锐炫B580显卡。我们分别进行了单张5批次的512×512分辨率文生图以及单张图生图测试,下面看看测试结果。
通过测试可以看到,锐炫B580的AI加速能力还是相当不错的,文生图单张5批次总计5张图的出图时间仅为31.1秒;而图生图速度也很快,用时仅为8.2秒,AIGC应用效率足以满足用户需求。
·性能对比
通过性能测试可以看到,锐炫B580的性能表现是超出不少预期的,尤其是在光追性能、4K分辨率方面,锐炫B580要远远优于第一代锐炫A770。同时,其3DMark理论性能也与实际表现更加接近,不再是高分低能。
当然,肯定有很多朋友想要了解它与竞品之间的性能差异,下面我们就来看看与RTX 4060和RTX 4060Ti相比,比他俩更便宜一些的锐炫B580是否有一战之力?
「3DMark跑分对比」
首先在3DMark理论性能测试上,锐炫B580依旧给力,除了光追性能和FireStrike E两项没有跑过RTX 4060Ti之外,其它跑分均高于RTX 4060Ti,并远超RTX 4060。
「大型3A游戏平均帧数」
3DMark跑分只是作为参考,实际表现还是得看游戏。笔者选取了《刺客信条:英灵殿》、《极限竞速:地平线5》、《无主之地3》三款大型3A游戏做对比。
其中,《无主之地3》的2K与4K分辨率表现非常出色,甚至超过了RTX 4060Ti。
而《刺客信条:英灵殿》与《极限竞速:地平线5》两款游戏,2K分辨率下锐炫B580在中表现与RTX 4060持平,4K分辨率甚至能跟RTX 4060Ti战的有来有回,考虑到锐炫B580比两款N卡更便宜,因此它完全可以取代RTX 4060和RTX 4060Ti,成为当前主流配置方案中显卡位的核心选择。
提到光追性能表现,以前N卡是绝对的优势方。I卡和A卡只要一开光追,差距立刻就会显现出来。然而锐炫B580最让人惊喜的地方,就是光追性能居然超过了非公版的RTX 4060Ti。还是参考《赛博朋克2077》,2K和4K分辨下,开启超级光追,XSS和DLSS都开启自动档,锐炫B580平均帧数分别为59fps和39fps,而RTX 4060Ti分别为58和29fps。锐炫B580的4K光追性能竟然能够领先RTX 4060Ti 10fps,这真的是完全没有预料到的情况。·拷机与游戏功耗
英特尔锐炫B580在各项性能测试层面都超出预期不少,那么它的功耗释放是怎样的呢?首先来看Furmark拷机测试,GPU核心功耗实测为130.7W,这个功耗直接拿给游戏本用都没啥问题,期待明年能有锐炫B580独显的游戏本出现。
游戏实机功耗我们参考了GPU负载巨大的《黑神话:悟空》,4K分辨率、超高画质下,功耗在78-100W之间,大多数时候跑在98W附近,结合实际性能来看,锐炫B580的能效比也是相当给力。
·控制中心
与锐炫B580一起来的,还有全新设计的Intel ARC控制中心。新的控制中心分为主页、配置、显卡、显示器以及性能五个主选项,主页可以查看当前的系统信息,如驱动版本、REBAR状态等等。
配置界面主要是游戏、应用的聚合页,用户可以通过这里系统化的管控和启动应用。
显卡页面提供了帧同步、帧率限制、低延迟模式、图像锐化、自适应细分五项优化功能,其中低延迟模式开启之后,游戏的帧生成时间会有比较显著的改善,这样可以增强游戏画面的了流畅度。
我们对锐炫B580进行了低延迟模式的测试,采用的游戏是《DOTA 2》。首先可以看到GPU Latency,关闭低延迟是5.98ms,开启后缩减到1.05ms;此时游戏的帧生成时间从6.26ms下降到5.92ms,个人感受是画面更加流畅顺滑了一些。
接下来的显示器页面其实就是对显示器的各项参数、显示模式进行调节,如果使用2个或以上多屏连接的话,这里调控起来要比Windows系统方便不少,而且可调节的功能选项也更多。
最后的性能选项里包含“指标”和“调优”两个子项目。指标主要可以查看当前系统硬件的工作状态,主要是GPU和CPU。如温度、利用率、帧数等等。
调优项目里可以对显卡的电压、功耗、频率、VRAM、风扇进行调节,而且提供了基础和高级两种选项,同时照顾到了小白用户和专业用户。
·评测总结
不吹不黑,英特尔锐炫B580的实际表现远超预期。其实笔者在今年中旬就基本得知了英特尔会继续推出第二代锐炫显卡,但考虑到第一代锐炫A系列的实际性能,原本对于第二代产品的性能没有抱过高期待,只希望2K分辨率能流畅运行3A大作即可。尤其当得知锐炫B系列首款显卡大概是中端等级的B580之后,其实不少媒体人和KOL也都并未对锐炫B580抱有太多期望。再加上英特尔官方分享的技术文档里,锐炫B580的平均游戏帧数只领先RTX 4060 10%,所以在测试之前其实是有一些轻视的。
但是通过实测可以看到,锐炫B580从现阶段来讲,将会是英特尔历史上最成功的一款桌面级显卡。定价2000左右,实际性能上限探到了3000价位的RTX 4060Ti,下限也能比它略贵一些的RTX 4060体验更好,而且在4K游戏、光追游戏方面的表现大大超出预期,因此在RTX 50系显卡未出之前,锐炫B580完全可以取代RTX 4060/4060Ti在主流配置方案中的位置。尤其是搭配性能不错的英特尔酷睿i5-13490F、酷睿i7-14790F这些高性价比处理器,不仅可以获得不错的游戏和生产力性能体验,同时攒机成本也不高,性价比拉满!
此外,英特尔GPU在视频编码、图片处理、AI计算方面得益于指令集、大显存等优势,其实从第一代锐炫A系列开始就已经能够独当一面了。而锐炫B580的表现可以说是再进一步,尤其是在AV1编码效率上,相比锐炫A770提升了1.5倍!同时在14bit无损照片处理、工程图渲染等诸多方面,锐炫B580都能够为用户提供足够高效的体验。这样一来,2000元的锐炫B580既可以胜任2K、4K以及光追游戏需求,又可以满足用户在生产力方面的高效体验,算得上是一款物超所值的主流级桌面显卡了。
最后别忘了,按照锐炫的命名方式,B5系列应该第二代锐炫的中端卡,大概率上面还有B7系列的产品,所以看了锐炫B580的性能,大家对锐炫B770(这个型号是猜的)是不是有了更多期待呢?
来源:中关村在线