CES 2025 NVIDIA发布干货汇总:Blackwell RTX 50登场,Project DIGITS深耕AI

B站影视 2025-01-07 20:52 3

摘要:太平洋时间2025年1月6日晚,NVIDIA创始人兼首席执行官黄仁勋在拉斯维加斯Mandalay Bay度假酒店的会议中心进行了一场CES 2025前夕的专场Keynote演讲。在这场每年CES例行的“NVIDIA 肌肉秀”上,黄仁勋不但基于AI的落地应用讲解

太平洋时间2025年1月6日晚,NVIDIA创始人兼首席执行官黄仁勋在拉斯维加斯Mandalay Bay度假酒店的会议中心进行了一场CES 2025前夕的专场Keynote演讲。在这场每年CES例行的“NVIDIA 肌肉秀”上,黄仁勋不但基于AI的落地应用讲解了NVIDIA在AI领域的深化研究与发展,而且还在这场会议上正式宣布了新一代Blackwell核心的GPU,并首发推出了RTX 5090、RTX 5080和RfTX 5070三个系列的产品,可以说是牵动着无数游戏玩家和AI创作者的心。

在会上,黄仁勋一共介绍了RTX 5090 、RTfX 5090 D、RTX 5080、RTX 5070 Ti和RTX 5070一共五款RTX 50系GPU,囊括了90、80和70三个家族产品系列。

“Blackwell作为 AI引擎为 PC 游戏玩家、开 发者和创作者带来全新体验。Blackwell 融合了 AI 驱动的神经网络渲染和光线追踪,是我们(指NVIDIA,编者注)在25年前推出可编程着色技术以来最重要的计算机图形创新。”——NVIDIA创始人兼首席执行官黄仁勋,2025 CES前夕Keynote演讲关于技术参数方面,目前NVIDIA还没给出具体的资料,从已有的信息来看,GeForce RTX 50系列GPU采用了NVIDIA新一代的Blackwell架构,相比前一代Ada Lovelace架构在性能方面有非常明显的提升。Blackwell架构搭配了第五代Tensor Cores和第四代RT

Cores,在AI渲染领域,包括神经网络着色器、数字人技术、几何图形和光照等方面,均取得非常明显的突破。这些技术进步不仅为图形设计师和视频编辑者带来了福音,也为游戏玩家提供了更加逼真的游戏体验。在虚拟世界中,每一个细节都栩栩如生,光线追踪技术让光影效果更加真实,仿佛置身于现实世界之中。

GeForce RTX 5090 D GPU拥有920亿个晶体管, ,AI算力最高可达2375TOPS(RTX 5090为最高3400TOPS),整个RTX 50系GPU制程工艺应该是TSMC 4nm。个人推测,其应该和RTX 5090一样配置了高性能高速度的32GB GDDR7显存,也是GDDR7 显存在独显产品上的首秀,使得RTX 5090 D的显存带宽最高可以达到1.7TB/s。加上Blackwell架构的创新和进化的DLSS 4使得GeForce RTX 5090 DGPU的性能高达GeForce RTX 4090 D GPU的2倍。在游戏性能上,RTX 5090 D很可能与RTX 5090差距不大(就像RTX 4090与RTX 4090 D),但由于众所周知的原因,在AI算力上,RTX 5090 D相比RTX 5090则会存在较大差异。

虽然仍然没有公布具体的规格,但从现有消息推测,RTX 5080应该是比GB202(RTX 5090)低一个序列的GB203,而且从首发价格来分析的话,其规格上相比RTX 5090应该是接近砍半的缩减。显存上的配置是16GB GDDR7,位宽256bit,显存整体带宽约为960GB/s。RTX 5080的AI算力为1800TOPS,大约是RTX 5090的55%。

最后看RTX 50系GPU的70系家族两位兄弟——RTX 5070和RTX 5070 Ti(按照惯例,其核心代号应为GB205?),也是本次首发的RTX 50系五款GPU之中最“接地气”的两款产品。GeForce RTX 5070 Ti大概率搭配了跟RTX 5080一样的16GB GDDR 7显存,受限于频率影响,整体显存带宽应该会略低于RTX 5080,但不会低太多。而在规格部分,RTX 5070 Ti整体硬件规格与RTX 5080相差约20%,基本与首发价格的差距一致。RTX 5070 Ti的AI算力约为1400TOPS,与RTX 5080仍然保持约20%~25%的性能差距。

GeForce RTX 5070或许是本次首发的五款RTX 50系GPU中最让人眼前一亮的产品。它不但在规格上保持了12GB GDDR7显存和533GB/s的高显存带宽,同时还配置了48个第四代RT Core和192个第五代Tensor Core。在整体性能表现上,NVIDIA宣布其已经超过了前一代的旗舰RTX 4090,性价比非常出色。

黄仁勋在Keynote演讲上也公布了搭配首发5款GPU中其中四款独立显卡的价格,从公布的消息来看,RTX 5090的首发指导价为1999美元,相比RTX 4090 1599美元的首发价格高出不少,但这款显卡现在对国内玩家来说也只能看看,倒也不必太在意。

真正需要关心的是RTX 5080及RTX 5070系的两兄弟。从价格上来看,它们相比RTX 40系的同位产品均降低了首发价格,RTX 5080相比RTX 4080在首发价格上降低了200美元(国内首发价格约8299元),RTX 5070 Ti和RTX 5070则相比RTX 4070 Ti及RTX 4070则是降低了50美元。所以,除去镜中花、水中月一般的RTX 5090,这次RTX 50系GPU的首发指导价相比上一代产品均有不同程度的降低,但是在性能上却有极大幅度的提升,我们认为尤其值得关注的是RTX 5070,以549美元的首发价格达到甚至超过了RTX 4090的性能,这下主流级游戏显卡市场毫无疑问会在它上市后迎来一次彻底的洗牌,游戏玩家可以重点关注。RTX 5070系两兄弟将在2025年2月上市,也就是中国农历新年之后。而RTX 5080和RTX 5090 D则会在1月30日大年初二正式上市。

最后特别说说RTX 5090 D。虽然搭载这款GPU的独立显卡产品并未直接在本次Keynote上公布具体价格,但考虑到RTX 4090 D与RTX 4090的对比,较大的可能性是RTX 5090 D相比RTX 5090价格不会有太大变化甚至没有变化。从会后了解到的消息来看,RTX 5090 D的首发指导价约为16499元人民币,和目前绝大部分RTX 4090 D显卡保持在同一价位,在价格不变的情况下获得了性能上的巨大增幅,显然RTX 5090 D的价格有利于吸引高端游戏玩家与设计创作者快速转向新一代核心的产品。

搭载NVIDIA GeForce RTX 5090 D、RTX 5080、RTX 5070 Ti和RTX 5070 GPU的标频版和超频版显卡可从华硕、七彩虹、耕升、影驰、技嘉、映众、微星、索泰、万丽、翔升、铭瑄、盈通等NVIDIA合作伙伴处(AIC)处购买,这些厂商的非公版产品也将在2025年1月30日上线销售。

在这场重要演讲上,NVIDIA的创始人兼首席执行官黄仁勋先生正式对外宣布了基于Blackwell架构的RTX 50系列笔记本电脑GPU的正式发布。此次发布的GeForce Blackwell笔记本电脑GPU系列包含了四款不同的型号,分别是RTX 5090、RTX 5080、RTX 5070 Ti以及RTX 5070。这些笔记本电脑GPU不仅完整地继承了它们桌面级兄弟产品的所有功能,还特别引入了移动计算领域的新特性,从而显著地提升了移动计算的性能。它们提供了令人瞩目的图形处理能力以及卓越的能耗表现。得益于NVIDIA Max-Q技术的加持,基于Blackwell架构的笔记本电脑在电池续航方面有了显著的提升,最高可以延长至40%。这使得轻薄型笔记本电脑在保持其时尚设计的同时,也无需在性能和功率上做出妥协。这一创新性的技术不仅为移动办公和学习带来了极大的便利,同时也为那些追求高性能和长续航时间的用户群体提供了一个理想的解决方案。

价格方面,这些产品确实具有相当的吸引力。具体来说,配备了顶级RTX 5090笔记本电脑GPU的游戏本,其首发指导价格定在了2899美元这样一个令人瞩目的数字。与此同时,那些搭载了稍低一些的RTX 5070笔记本电脑GPU的产品,首发指导价则更为亲民,仅为1299美元。这样的定价策略无疑为消费者提供了极高的性价比,使得这些笔记本电脑在市场上的竞争力极大增强。

多项基于AI的游戏、设计创作技术亮相从FG到MFG,DLSS 4多帧生成技术首次亮相

在最近的CES(国际消费电子展)上,NVIDIA公司正式对外宣布了基于其RTX AI技术的最新一代深度学习超级采样技术——DLSS 4。这一技术的推出标志着DLSS系列技术的又一次重大进步。与之前的DLSS 3.5版本相比,DLSS 4引入了一个重要的新特性,那就是名为Multi Frame Generation(MFG,即多帧生成技术)的功能。通过利用人工智能的强大计算能力,DLSS 4能够为每个渲染帧额外生成多达三帧的AI补足渲染画面。这一创新技术的应用,使得游戏和其他图形密集型应用的帧率得到了显著提升。DLSS 4的多帧生成技术不仅能够独立工作,还能够与现有的全套DLSS技术无缝协同,共同作用于图形渲染流程中。与传统的图形渲染技术相比,DLSS 4能够将性能提升至最高8倍,极大地增强了图形处理能力。此外,配合NVIDIA Reflex技术,DLSS 4还确保了在提升性能的同时,不会牺牲游戏的响应速度,为玩家提供了流畅且快速的游戏体验。

DLSS 4 引入了图形行业首个实时应用的 Transformer 模型。这一创新技术基于先进的 Transformer 架构,它不仅带来了超分辨率和光线重建模型的革命性改进,而且其参数量是先前版本的两倍,计算量更是达到了惊人的四倍。这样的大幅度提升,使得画面的稳定性得到了显著的增强,有效减少了伪影现象,增加了细节表现,并且显著增强了抗锯齿效果。随着 GeForce RTX 50系列GPU对DLSS 4 的支持,自发布之日起,这项技术已经得到了广泛的应用,超过75款游戏和应用程序采纳了这项技术,其中包括《战神:诸神黄昏》《冰汽时代2》《幽灵行者2》《赛博朋克2077》等众多广受欢迎的游戏佳作,这些作品通过DLSS 4 技术的加持,为玩家带来了更加逼真和流畅的游戏体验。

NVIDIA的低延迟技术Reflex也得到了升级,Reflex 2正式公布。NVIDIA Reflex 2支持 Frame Warp,这项创新技术可在将渲染帧发送至显示器前,根据最新的鼠标输入信号对其进行更新,从而降低游戏延迟。与原生渲染相比,Reflex 2 最高可降低 75% 延迟,为多人竞技类游戏玩家带来制胜优势,也能提高单人游戏操作时的响应速度。

NVIDIA借着RTX 50系GPU的发布也对其低延迟技术Reflex进行了重大升级,正式推出了Reflex 2。这一新版本不仅延续了Reflex技术的核心优势,还引入了一项名为Frame Warp的创新功能。Frame Warp技术能够在渲染帧被发送到显示器之前,根据最新的鼠标输入信号实时更新这些帧,从而显著降低游戏中的延迟。

具体来说,与传统的原生渲染相比,Reflex 2技术能够将游戏延迟降低高达75%。这一突破性的进步对于多人竞技类游戏玩家来说,意味着他们将获得更大的竞争优势,因为更低的延迟可以让他们更快地响应游戏中的各种情况。此外,对于单人游戏的操作体验,Reflex 2同样能够提高响应速度,使玩家的操作更加灵敏和精准。通过这一系列技术改进,NVIDIA不仅巩固了其在游戏显卡领域的领先地位,还为游戏玩家带来了更加流畅和沉浸式的游戏体验。

▲相比Reflex,Reflex 2能进一步极大降低游戏内系统延迟。

25年前,NVIDIA 推出了 GeForce 3 和可编程着色器,从像素着色到计算着色,再到实时光线追踪,为过去20年的图形技术创新奠定了坚实的基础。除了 GeForce RTX 50 系列 GPU,NVIDIA 还推出了 RTX 神经网络着色器(RTX Neural Shaders),将小型 AI 网络集成到可编程着色器中,为实时游戏带来了电影级别的材质和光照效果。

在实时图形渲染中,渲染游戏角色一直是一项极具挑战性的任务,玩家很容易察觉到数字角色身上的微小瑕疵和视觉干扰。RTX Neural Faces 仅需简单的光栅化面孔和3D 面部姿态数据作为输入,便能利用生成式 AI 实时渲染出具有时间稳定性的逼真面孔。

RTX Neural Faces 配备了创新的RTX技术,该技术支持光线追踪毛发和皮肤,为角色带来前所未有的真实感。全新的RTX Mega Geometry技术可将场景中的光线追踪三角形数量提升至多100倍,显著增强了游戏角色及其环境的真实度。在CES上,GeForce RTX 50系列通过展示突破性的技术演示Zorah,展示了神经网络渲染、DLSS 4以及全新DLSS Transformer模型的强大能力。

GeForce RTX 50系列GPU具备业界领先的AI TOPS算力,可在游戏渲染的同时为拥 有自主意识的游戏角色提供动力。

NVIDIA在之前就已经推出了一套全新NVIDIAACE技术,使游戏角色能够像真人玩家一样感知环 境、制定计划并付诸行动。由 ACE 驱动的拥有自主意识的角色将集成到 KRAFTON 的《绝地求生》和该发行商即将推出的生活模拟游戏InZOI ,Wemade Next 的《传奇 5》以及网易的《永劫无间手游》PC版中。

▲NVIDIA ACE可以创造具备自主性的智能游戏角色

在《绝地求生》中,由 NVIDIA ACE 驱动的 AI 队友规划战略和实施战术行动,与真人 玩家动态合作以确保可以存活下来。InZOI的 Smart Zoi角色,可以根据角色的人生目标和游戏内事件自主调整行为。在《传奇5》中,LLM 驱动的突袭 Boss 可根据玩家行为调整战术,营造更动态、更具挑战性的战斗。

▲NVIDIA ACE在《绝地求生:大逃杀》中可以驱动AI队友完成更精准和正确的战略实施

《永劫无间手游》PC 版将在3月添加基于 NVIDIA ACE技术的本地推理AI 队友功能,《永劫无间》PC版也将在2025年内发布此功能。该游戏将是首款采用 NVIDIA ACE和大语言模型在PC端侧实现AI队友功能的国产游戏,借助由NVIDIA ACE提供支持的AI队友可以与玩家组队,并肩作战。

▲《永劫无间》游戏中,借助NVIDIA ACE也能获得更加智能的AI队友。

NIM 微服务和AI Blueprint,NVIDIA推出适配RTX AI PC的AI基础模型

NVIDIA 在 CES 2025 上宣布推出可在 NVIDIA RTX AI PC 上本地运行的基础模型,为数字人、内容创作、生产力和开发领域带来了强大的支持。

这些基础模型以 NVIDIA NIM 微服务的形式呈现,由全新的 GeForce RTX 50 系列 GPU 提供加速,性能高达 2375 AI TOPS,并配备 32GB 显存。基于 NVIDIA Blackwell 架构的 RTX 50 系列 GPU 是首批支持 FP4 计算精度的消费级 GPU。相较于前代产品,AI 推理性能翻了一番,使得生成式 AI 模型能够在本地以更小的显存占用高效运行。AI 基础模型包括了 LLM、视觉语言模型、图像生成、语音识别、检索增强生成的嵌入模型、PDF 提取和计算机视觉等多种应用场景。NIM 微服务以及在 PC 上运行 AI 所需的所有组件都已针对所有 NVIDIA GPU 进行了优化。

为向RTX技术的热衷者及开发者展示如何运用NVIDIA的NIM微服务架构构建先进的人工智能智能体与智能助手,NVIDIA宣布将推出一系列精心策划的NVIDIA NIM微服务及NVIDIA AI蓝图。这些资源由诸如Black Forest Labs、Meta、Mistral和Stability AI等业界翘楚的模型开发公司,为RTX AI PC平台量身定制。特别地,针对AI智能体与AI助手的开发,NVIDIA推出了名为Project R2X的创新项目。Project R2X致力于打造一个具备视觉识别功能的PC虚拟形象,旨在使信息获取更为便捷,并协助用户高效地操作桌面应用程序、参与视频会议、阅读及概括文档等任务。在未来数月内,Project R2X将向GeForce RTX 50系列的PC及笔记本电脑用户开放下载,为AI热衷者及开发者提供个性化定制与深入体验这一前沿技术的机会。

GeForce RTX 50系列GPU能够显著提升创意工作流的效率。作为首个支持FP4计算精度的消费级GPU,RTX 50系列GPU相较于前代产品,在AI图像生成(例如Flux模型)方面实现了高达两倍的性能提升,并且使得生成式AI模型能够在本地运行,同时显著减少了显存的占用。

与此同时,在NVIDIA公司推出RTX 50系列GPU的时刻,NVIDIA Broadcast应用也迎来了一系列创新,为内容创作者们带来了两项由AI技术驱动的新功能。首先是Studio Voice(音棚音效),这项功能能够显著提升麦克风捕捉到的音频质量,使其达到甚至超越高质量麦克风所能提供的声音效果。紧接着是Virtual Key Light(虚拟补光),它通过智能算法对面部进行重新打光,确保光线均匀覆盖,仿佛被两盏专业灯光均匀照亮,从而使得直播画面更加精致和专业。除此之外,Streamlabs也推出了一个由NVIDIA ACE和Inworld技术共同支持的智能直播助手,这个助手能够扮演助播、制作和技术支持等多重角色,进一步提升直播的整体体验。

由于这些新功能都依赖于对计算能力要求极高的AI模型,因此NVIDIA建议用户在进行视频会议或非游戏类直播时,最好使用GeForce RTX 5080或更高版本的GPU。为了更好地满足用户的需求,NVIDIA Broadcast的升级版本还引入了一个全新的用户界面,它允许用户同时应用多种效果,同时对背景噪声消除、虚拟背景和眼神接触效果进行了显著的改进。NVIDIA公司已经宣布,经过这次更新的NVIDIA Broadcast应用程序预计将在2025年2月正式发布。

Grace Blackwell桌面系统 ,让每位 AI 开发者都触手可及

CES上的另一个劲爆消息是NVIDIA正式推出个人AI超级计算机NVIDIA Project DIGITS,这会让全球的 AI 研究员、数据科学家和学生都可获取 NVIDIA Grace Blackwell平台的强大功能。

Project DIGITS搭载了全新的NVIDIA GB10 Grace Blackwell超级芯片,其性能最高可达1 PFLOPS,专为AI大模型的原型设计、微调及运行而设计。GB10超级芯片基于NVIDIA Grace Blackwell架构,是一款片上系统(SoC),能够以FP4计算精度提供高达1 PFLOPS的AI性能。

GB10采用了NVIDIA Blackwell GPU,该GPU配备了最新一代的CUDA Core和第五代Tensor Cores,并通过NVLink-C2C片间互连技术与一颗高性能的NVIDIA Grace CPU相连(该CPU由联发科共同研制)。该CPU基于ARM架构,拥有20个高效节能的核心。GB10超级芯片使得Project DIGITS仅需使用标准电源插座即可提供卓越的性能。每个Project DIGITS均配备了128GB的统一高一致性内存和4TB的NVME SSD存储空间。利用Project DIGITS,开发者能够运行包含高达200B参数的大语言模型,从而加速AI创新进程。通过NVIDIA ConnectX网络,可以将两台Project DIGITS AI超级计算机连接起来,共同运行包含高达4050亿参数的模型。

▲借助Project DIGITS,用户可以使用自己的桌面系统开发和运行模型推理,并在加速的云或数据 中心基础设施上无缝部署模型。

正如NVIDIA创始人兼首席执行官黄仁勋在会上所表示:“AI 将成为每个行业的主流应用。借助 Project DIGITS ,Grace Blackwell超级芯片将惠及数百万开发者,将 AI 超级计算机置于每位数据科学家、AI 研究人员和学生的案头,助力他们参与并缔造 AI 时代。”

通过利用Grace Blackwell架构,企业界和研究机构得以在本地的Project DIGITS系统上,该系统运行在基于Linux的NVIDIA DGX OS上,进行模型的原型设计、调优和测试工作。这一过程不仅高效而且无缝,使得他们能够轻松地将这些模型部署到 NVIDIA DGX Cloud、加速云实例或任何数据中心基础设施中。开发者们可以在Project DIGITS上构建 AI 原型,然后利用与Project DIGITS相同的Grace Blackwell架构和NVIDIA AI Enterprise软件平台,在云端或数据中心基础设施上进行扩展和进一步的开发。

Project DIGITS的用户能够接触到一个庞大的NVIDIA AI软件库,这个库专为实验和原型设计而设,其中包含了丰富的资源,如NVIDIA NGC目录和NVIDIA开发者门户网站所提供的软件开发套件、编排工具、框架和模型。开发者们可以利用这些资源,借助NVIDIA NeMo框架进行模型微调,使用NVIDIA RAPIDS库来加速数据科学工作流程,并且能够运行诸如 PyTorch、Python和Jupyter notebooks等广泛使用的开发框架。

除此之外,开发者们还可以通过参与NVIDIA开发者计划,利用NVIDIA Blueprint和NVIDIA NIM微服务,进行深入的研究、开发和测试工作,以构建代理式AI应用。当AI应用经过充分的实验和验证,准备从实验阶段转向生产环境时,NVIDIA AI Enterprise许可证将提供企业级的安全性、技术支持以及NVIDIA AI软件的产品发布,确保应用的顺利过渡和高效运行。

来源:微型计算机

相关推荐