摘要:在2025年国际消费类电子产品展览会(CES 2025)上,英伟达凭借RTX 5090显卡的发布抢尽风头,带来了众多新技术,其中最为引人注目的是DLSS 4。DLSS 4技术为英伟达GPU引入了多帧生成功能,当RTX 50系列显卡上市时,能立即为超过75款游戏
【CNMO科技】在2025年国际消费类电子产品展览会(CES 2025)上,英伟达凭借RTX 5090显卡的发布抢尽风头,带来了众多新技术,其中最为引人注目的是DLSS 4。DLSS 4技术为英伟达GPU引入了多帧生成功能,当RTX 50系列显卡上市时,能立即为超过75款游戏提供高达4倍的性能提升。
然而,关于DLSS 4的实际运行机制,市场上存在诸多误解。这既受到了英伟达CEO某些可能产生误导的言论的影响,也与DLSS技术本身的重大变化有关。因此,市场上对于这项新技术的功能、能力以及重要限制存在着不少错误信息。
并不能“预测未来”
关于正确理解DLSS 4工作原理的一大障碍,源自英伟达CEO黄仁勋在一次问答活动中的表述。面对媒体关于DLSS 4技术细节的询问,黄仁勋坚决否认DLSS 4采用了帧插值技术,而是将其描述为“预测未来”,而非“插值过去”。这一言论虽然有助于向公众普及DLSS 4等高级技术概念,却也不幸地引发了关于DLSS 4实际运作机制的误解。
DLSS 4的多帧生成技术本质上运用了帧插值方法,这与DLSS 3的技术基础一致,也是其他帧生成工具(例如Lossless Scaling和AMD的FSR 3)所采纳的方法。帧插值的过程是:显卡先渲染两帧图像,然后通过算法分析这两帧间的差异,并据此“推算”出一个中间帧,即根据已渲染帧的差异预测出缺失帧的样貌。
尽管关于生成帧的新技术(特别是英特尔的帧外推研究)的早期探索已经起步,但该技术仍处于发展阶段。尽管某些细节目前尚未公开,但多方信息已证实,DLSS 4确实采用了帧插值技术。这并不奇怪,因为这类渲染工具的发展往往伴随着大量研究论文的积累,最终才转化为如DLSS 4这样的市场产品。
然而,这并不减损DLSS 4的性能优势。尽管在创建新帧时采用了与DLSS 3相似的技术,但这并不应掩盖DLSS 4所能达成的显著成效。
延迟并非线性增长
英伟达对于DLSS 4采用帧插值技术保持低调的一个主要原因不难洞悉,帧插值可能会带来延迟问题。在使用帧插值工具时,需要在显示序列的首帧之前预先渲染两帧,随后执行插值操作,因此本质上会存在一定的延迟。
部分媒体曾表达忧虑,希望了解“新的帧生成技术如何影响延迟”,另有媒体则指出“用户担忧多帧渲染可能加剧‘延迟’问题”。这些担忧源于对DLSS 4能够生成多个“虚拟”帧的直观理解,如果生成一帧会增加延迟,那么生成更多帧似乎会进一步加剧延迟。然而,事实并非如此简单。
理解DLSS 4采用帧插值的关键在于无论是DLSS 3生成一个额外帧,还是DLSS 4生成三个额外帧,延迟的影响机制本质上是一致的,都需要先渲染两帧,并比较它们之间的差异。在两帧之间插入一帧、两帧或三帧,所引入的延迟增量并非线性增长。无论插值多少帧,该过程带来的延迟大致保持恒定。
以实例说明,假设游戏以每秒60帧(fps)运行,即每帧间隔16.6毫秒。使用DLSS 3后,帧率翻倍至120 fps,但延迟并未减半至8.3毫秒;游戏画面虽更流畅,但帧间渲染间隔仍为16.6毫秒。同理,DLSS 4可将帧率提升至240 fps,即四倍于原始帧率,但延迟亦不会骤降至4.2毫秒,而是保持在16.6毫秒。
这是对PC延迟的简化阐释,未考虑DLSS帧生成的运算开销、显示器及鼠标引入的延迟等因素,但有助于理解在帧插值中增加帧数时,核心延迟并不线性增长。帧间渲染时间间隔不变,所经历的延迟主要仍取决于DLSS帧生成前的基准帧率及工具开销。
尽管大部分额外延迟源自缓冲额外帧的过程,但增加更多中间帧带来的延迟增量相对较小。DLSS计算渲染两帧间更多帧的额外延迟有限,因此DLSS 4与DLSS 3相比,延迟增加并不显著。
DLSS 4的延迟特性与DLSS 3相似。若基准帧率较低,响应性与视觉流畅性之间可能出现脱节,这在DLSS 4中可能更为显著,但并不意味着延迟会急剧上升。因此,英伟达的新技术Reflex 2虽令人瞩目,但并非DLSS 4的必需配套。与DLSS 3一样,开发者为DLSS 4实现Reflex的基础版本即可。
DLSS 4的工作原理
英伟达对于DLSS 4工作原理的说明或许会让人感觉它只是DLSS 3的自然演进,但实际上,两者之间存在显著的区别。DLSS 4之所以与众不同,很大程度上是因为它采用了全新的AI模型架构,更准确地说,是多种AI模型的集成应用。据英伟达详尽介绍,在执行超分辨率、光线重建及多帧生成任务时,DLSS 4会为每一帧渲染部署五个独立的AI模型,且这些模型都需在毫秒级时间内高效运行。
针对DLSS 4的任务需求,英伟达摒弃了传统的卷积神经网络(CNN),转而采用视觉Transformer模型。这一转变带来了两大关键变化。一是引入了“自注意力”机制,使模型能够跨越多帧追踪像素的重要性,通过自我参照的方式,新模型能更精准地聚焦于问题区域,比如超分辨率处理中可能出现的细微闪烁问题。
此外,Transformer模型还具备更高的可扩展性,为DLSS 4提供了远超以往CNN方法的参数数量。据英伟达透露,新的Transformer模型参数量实际上翻倍了。
从展示的内容来看,英伟达声称这种新模型在提升稳定性和保留精细细节方面相较于CNN方法有了显著提升。值得注意的是,这些改进不仅限于RTX 50系列GPU,所有RTX显卡都能在支持DLSS 4的游戏中受益于这种新的Transformer模型,当然,这要在每代显卡支持的功能范围内。
写在最后
尽管DLSS 4已经经过多次展示,但其真正的能力将在英伟达下一代GPU发布时得到全面检验。届时,用户将能在多款游戏和多种场景中评估DLSS 4的实际表现。
来源:手机中国