光追+AI,AMD芯片架构史诗级革新!NVIDIA 要慌了吗?

B站影视 电影资讯 2025-08-28 18:57 1

摘要:如果你是一位游戏玩家,或者关注显卡市场,那么RDNA 4这个名字应该不会陌生。它是AMD今年推出的全新图形架构,目前已经应用于Radeon RX 9000系列显卡中。

AMD在2025年Hot Chips大会上,向与会者介绍 RDNA 4 架构的最新情况,并透露了在最初发布时未涵盖的更多细节。

如果你是一位游戏玩家,或者关注显卡市场,那么RDNA 4这个名字应该不会陌生。它是AMD今年推出的全新图形架构,目前已经应用于Radeon RX 9000系列显卡中。

AMD明确表示,RDNA 4是一个专注于游戏图形的架构。与之前试图兼顾游戏与计算的策略不同,这次AMD显然将全部精力投入到了游戏体验的提升上。

最大的两个改进领域是光线追踪和机器学习硬件。这两个方向正好对应了现代游戏发展的两大趋势:更逼真的光影效果和更智能的图像处理技术。

除了这两大亮点,AMD还在压缩技术、媒体和显示引擎方面做了重大升级。这些改进可能不像光线追踪那样引人注目,但对整体用户体验的提升同样重要。

特别是媒体引擎的改进,让视频编码和解码能力大幅提升,对于内容创作者来说尤其重要。

从逻辑设计来看,RDNA 4延续了多着色器引擎的设计思路。单个GPU由最多多个着色器引擎组成,这种设计提供了良好的扩展性和灵活性。

这一代架构显著扩大了L2缓存容量,主要是为了更好地支持光线追踪工作负载。更大的缓存意味着更多数据可以就近存储,减少访问主内存的次数,从而提高效率。

这也是AMD第三代Infinity Cache技术。从RDNA 2开始引入的Infinity Cache已经发展到第三代,技术成熟度显著提高,能够更有效地保持核心计算单元的数据供应。

光线追踪一直是AMD相比NVIDIA的短板,但在RDNA 4架构中,这种情况发生了根本改变。AMD实现了光线追踪性能的约2倍提升,这是一个令人印象深刻的数字。

那么AMD是如何做到的呢?首先,他们加倍了光线相交测试的能力。每个Ray Accelerator现在有两个Intersection Engine,而不是前代的一个。这意味着每个周期可以进行八个框测试或两个三角形测试,而不是之前的四个框测试或一个三角形测试。

AMD还增加了专用的硬件实例变换器,将这个任务从着色器程序中卸载出来。这意味着处理多个相似对象(如场景中的多个相同椅子)时效率大大提高。

最引人注目的新技术是定向边界框(OBB)。传统的轴对齐边界框(AABB)在处理不与世界轴对齐的几何体时会产生大量空白空间,导致许多误报相交。

OBB技术通过旋转边界框来更好地匹配其中的几何体,显著减少了误报相交。从AMD展示的热力图来看,改进效果非常明显。

RDNA 4还引入了乱序内存访问功能。光线追踪的工作负载极其发散,不同请求的完成时间差异很大。乱序内存访问允许独立的请求继续前进,而不必等待其他延迟的请求,从而提高了整体效率。

RDNA 4在着色器引擎中引入了动态寄存器分配机制。这是一个相当巧妙的设计,解决了光线追踪中的一个具体问题。

在光线追踪过程中,不同阶段对寄存器的需求差异很大。遍历阶段使用相对较少的寄存器,而着色阶段则需要大量寄存器。RDNA 3会基于最坏情况分配寄存器,导致资源利用不充分。

RDNA 4能够动态分配寄存器,只在需要时使用,并在不再需要时释放。这一改进使AMD能够增加飞行中的波数量,通过利用释放的寄存器来容纳更多的波。

这种改进听起来很技术性,但实际效果很直观:更高的硬件利用率和更好的性能。

RDNA 4在AI和机器学习能力方面也有重大提升。增加了对FP8数据类型的支持,并引入了结构化稀疏性技术。这些改进使得机器学习工作负载的处理更加高效。

AI在现代游戏图形中扮演着越来越重要的角色。路径追踪能够产生更好的效果,但需要 massive 数量的光线。发送所有所需光线的成本太高,这时AI就派上了用场。

通过神经辐射缓存以及神经超采样和去噪,AI可以填补使用过少光线带来的空白。这就是为什么强大的AI能力对现代GPU如此重要。

RDNA 4在媒体和显示引擎方面的改进可能不如光线追踪和AI那样耀眼,但对用户体验同样重要。

Navi 48 GPU中有两个媒体引擎。媒体块收到了一些重要的编码器更新,例如为AV1编码添加B帧,以及整体降低延迟。这些改进使得视频编码效率和质量都有显著提升。

显示块也增加了一些新功能,例如将Radeon图像锐化2集成到块本身中,而不是作为着色器效果进行处理。这种硬件集成提高了效率并降低了延迟。

RDNA 4采用了一种结构化的模块化设计。AMD设计Navi 48的方式使得它基本上可以被切成两半来制造更小的GPU,这大大减少了开发GPU变体所需的工作量。

这种模块化设计还允许更好地利用不完全合格的芯片,通过熔断故障部分来创建不同等级的产品。这不仅提高了良品率,还让AMD能够更灵活地响应市场需求。

可靠性、可用性和可服务性(RAS)功能也在这种模块化设计中发挥作用,提高了产品的整体可靠性。

RDNA 4引入了新的内存压缩和解压缩功能。这些功能对软件完全透明,全部在硬件中处理。AMD表示看到了约25%的fabric带宽使用减少。

即使在单个GPU内,这也是灵活的,允许熔断各种块以制造新的显卡SKU和挽救不完美的晶圆。这种灵活性是RDNA 4架构的一个重要优势。

所有这些技术改进最终都服务于一个目的:提升游戏体验。凭借其光线追踪和AI/ML能力,RDNA 4为下一代游戏做好了准备。

对于游戏玩家来说,这意味着更逼真的光影效果、更高分辨率的纹理、更流畅的动画和更智能的图像处理。特别是光线追踪性能的大幅提升,使得AMD显卡现在能够提供与竞争对手相媲美的光线追踪体验。

内容创作者也将从改进的媒体引擎中受益。更好的编码效率意味着更快的视频导出时间和更高质量的流媒体体验。

RDNA 4架构的推出,标志着AMD在图形领域的全面进化和对未来的坚定信念。光线追踪与AI的双重革新,不仅仅为了更高的帧数,更是为了开启游戏图形的新纪元。

当玩家们沉浸在更加逼真的游戏世界中时,或许不会想到背后这些技术细节。

但正是这些创新,让虚拟世界与现实世界的边界变得越来越模糊。

来源:算泥社区

相关推荐