摘要:在科技行业风云变幻的当下,英伟达曾面临诸多挑战,股价波动、市场质疑声不断。然而,在近日英伟达举办的 GTC 2025 大会上,创始人黄仁勋通过一场长达 150 分钟的主题演讲,为英伟达找到了新的发展曙光 ——Agentic AI(智能体人工智能),仿佛在黑暗中
在科技行业风云变幻的当下,英伟达曾面临诸多挑战,股价波动、市场质疑声不断。然而,在近日英伟达举办的 GTC 2025 大会上,创始人黄仁勋通过一场长达 150 分钟的主题演讲,为英伟达找到了新的发展曙光 ——Agentic AI(智能体人工智能),仿佛在黑暗中点亮了一盏明灯,照亮了英伟达未来的前行之路。
今年以来,英伟达的股价走势犹如过山车。此前,市场上对英伟达的质疑声此起彼伏,尤其是以 DeepSeek R1 为代表的产品出现后,业内开始反思 “我们真的需要这么多 GPU 吗”。这种质疑并非空穴来风,随着技术的发展,越来越强大且数量众多的开源小模型只需一块 GPU 就能运行,同时,市场上还涌现出了越来越多的平替产品。在这样的背景下,英伟达急需一场胜利演说,来重塑市场信心,而黄仁勋将希望寄托在了 Agentic AI 上。
黄仁勋在演讲中指出,英伟达踏入 AI 风口的这十几年间,AI 历经了三代技术范式的转变。当 AI 从 ChatGPT 那种依赖预测下一个词元(tokens)、容易产生幻觉的生成式 AI,迈向 Deep Research、Manus 这类 agentic AI 应用时,计算模式发生了巨大变化,所需的 tokens 数量比想象中多出 100 倍。当下,我们正处于 Agentic AI 时代,AI 变得越发智能,应用场景也不断拓展,而这一切都离不开强大算力的支撑。
他以同一段提示词下,开源模型 Llama3.3 和 Deepseek-R1 所消耗的 tokens 为例进行说明。强化学习主导的推理类应用,消耗的 tokens 数量大幅增加,不过也使得 AI 应用的可靠性显著提升。Agentic AI 应用的运行,是无数次调用类似 DeepSeek-R1 进行推理的过程,这无疑需要海量的计算资源。这也解释了为何 ChatGPT 可以免费使用,而 Deep Research 和 Operator 这类 agent 却难以做到免费(当前 OpenAI 分别以 20 美元、200 美元的价格提供服务)。
面对 Agentic AI 时代对算力的巨大需求,英伟达积极布局,推出了一系列举措。在数据中心领域,加速 AI 工作负载的新型数据中心 ——“AI 工厂” 应运而生。其核心任务是高效处理 tokens,将 AI 语言转化为智能。通过软硬件一体化的优化,以更低的计算成本处理更多的 tokens。当复杂、智能的推理模型需要更快、更多地吞吐 tokens 时,一套高效的软硬结合计算系统就成为了 AI 应用能否盈利的关键所在。
为了实现这一目标,英伟达推出了新的 “AI 工厂” 引擎操作系统 Dynamo。黄仁勋将这个推理服务库比作新时代的 VMware,它能够自动编排,让 AI 在推理时代运行得更加高效,每秒生成更多的 token。黄仁勋更是直接向采购英伟达数据中心的企业呼吁:未来,每个数据中心都将面临功耗限制,采用 Blackwell,在相同电力下可获得更优性能;搭配 Dynamo,Blackwell 的性能将进一步优化(Hopper 也能优化,但效果不如 Blackwell)。据英伟达称,使用 Dynamo 优化推理,能让 Blackwell 上的 DeepSeek-R1 吞吐量提升 30 倍,且 Dynamo 完全开源。
在硬件方面,黄仁勋宣布了 Blackwell AI 工厂平台的下一个演进版本 ——Blackwell Ultra,旨在进一步增强 AI 推理能力。与现有的 Blackwell 不同,Blackwell Ultra 专为 AI 推理设计。在 DeepSeek R1 发布后,OpenAI o1 与 Google Gemini 2.0 Flash Thinking 等推理模型产品已上市。Blackwell Ultra 具体包括 GB300 NVL72 和 HGX B300 NVL16 系统,其 AI 性能比前代产品高出 1.5 倍。GB300 NVL72 在一个机架规模设计中连接了 72 个 Blackwell Ultra GPU 和 36 个基于 Arm Neoverse 的 NVIDIA Grace CPU。与 Hopper 一代相比,HGX B300 NVL16 在大型语言模型上推理速度快 11 倍,计算能力多 7 倍,内存大 4 倍,并且同样支持新发布的 NVIDIA Dynamo 推理框架。包括 AWS、谷歌云和微软 Azure 在内的主要科技公司和云服务提供商,将从 2025 年下半年开始提供由 Blackwell Ultra 驱动的实例。
此外,英伟达还公布了 2026 年和 2027 年数据中心路线图的更新,其中包括即将推出的下一代 AI 芯片 Rubin(以天文学家 Vera Rubin 命名)与 Rubin Ultra 的计划配置。Rubin NVL144 机架将与现有的 Blackwell NVL72 基础设施直接兼容,而 Rubin Ultra 的整个机架将被新的布局 NVL576 取代。同时,英伟达首次公开了其光芯片在 AI 计算领域的进展。硅光芯片具备高运算速度、低功耗、低时延等特性,且在制造工艺上,无需像电子芯片那样追求极致的工艺尺寸缩小,也不必依赖极紫外光刻机(EUV)。目前,英伟达与台积电合作,采用台积电的硅光子平台 Compact Universal Photonic Engine(COUPE),该平台使用台积电的 SoIC-X 封装技术,将电子集成电路(EIC)与光子集成电路(PIC)相结合,打造出两款产品 Spectrum-X 和 Quantum-X。
可以说,Agentic AI 为英伟达带来了新的发展机遇,成为了挽救其市场地位的关键因素。它不仅重新定义了 AI 的发展方向,也让英伟达在这场科技变革中再次找准了定位。随着相关技术和产品的不断落地应用,英伟达有望在 Agentic AI 时代续写辉煌,继续引领 AI 领域的发展潮流。但同时,市场竞争依旧激烈,众多竞争对手也在纷纷发力,英伟达能否持续保持领先,仍有待时间的检验。
来源:人工智能学家