摘要:相较于上一代 Hopper(霍珀) 架构,Blackwell 实现了40 倍的性能提升,通过将两个 GPU 核心封装于单一芯片,引入NV Link 72高速互联技术之后,单机架的算力成功突破ExaFLOPS级别(即每秒百万万亿次浮点运算)。
在 2025 年 GTC GPU 技术大会上,英伟达创始人黄仁勋的演讲被视作 “AI 界超级碗”。
从芯片架构的代际突破到机器人技术的全面革新,从开源生态的构建到全球算力网络的布局,英伟达以 “AI 工厂” 为核心概念,推动着计算范式的颠覆性变革。
英伟达新一代Blackwell架构的发布,无疑标志着AI算力踏入新纪元。此架构问世,仿若于AI算力发展长河中树立起崭新里程碑,预示着全新时代即将开启。
相较于上一代 Hopper(霍珀) 架构,Blackwell 实现了 40 倍的性能提升,通过将两个 GPU 核心封装于单一芯片,引入NV Link 72高速互联技术之后,单机架的算力成功突破ExaFLOPS级别(即每秒百万万亿次浮点运算)。
这种 “纵向扩展” 策略打破了传统分布式计算的瓶颈,通过硅光子技术实现的低功耗高速互联,使得多个 GPU 可视为单一计算单元,内存带宽达到每秒 570TB,为处理万亿参数级模型提供了硬件基础。
黄仁勋同时公布了未来十年的技术路线图:2026 年推出的 Vera Rubin 架构将集成新一代 CPU 与 GPU,算力再提升 14 倍;2027 年的 Famine 架构则通过硅光子技术实现百万 GPU 级集群互联,目标是在相同功耗下实现千倍性能提升。
这些路线图不仅是技术规划,更是对全球数据中心建设的前瞻性指引,英伟达预测,2030 年全球 AI 工厂建设规模将达 1 万亿美元,传统通用计算向加速计算的转型已进入不可逆的拐点。
英伟达为降低企业的AI部署门槛,于演讲中宣布开源两大核心项目:Dynamo操作系统与Grutin通用人形机器人平台。
Dynamo被称为“AI工厂的操作系统”,其核心价值在于化解复杂推理场景中的资源调度难题。通过动态分配算力至 “预填充”(数据消化)与 “解码”(结果生成)阶段,可根据实时负载优化 Token 生成效率,使算力利用率提升 300% 以上。
Grutin平台将目光瞄准机器人领域的“通用智能”这一难题。通过双系统架构模拟人类 “快思考” 与 “慢思考” 机制,慢系统负责环境理解与任务规划,快系统实现动作精准控制,Grutin 可快速掌握操作工具、协同作业等复杂技能。
在演讲中,黄仁勋首度系统地阐述了“能动型AI”(Agentic AI)与“物理AI”(Physical AI)这两个概念。前者指具备自主推理、工具使用与计划执行能力的智能体。
例如可自主浏览网页、分析数据并生成报告的 AI 助手;后者则专注于理解物理规律,如摩擦力、惯性、物体恒存性,使 AI 能操控机械臂完成精密装配,或驾驶汽车应对复杂路况。
物理 AI 的突破依赖三大技术支柱:一是基于强化学习的 “可验证回报” 机制,通过模拟物理定律生成训练数据(如让 AI 在虚拟环境中反复尝试抓取玻璃球,失败则给予负反馈);
二是高精度物理引擎 Newton,可实时模拟刚体、柔体及触觉反馈,其计算速度比传统引擎快 10 倍以上;三是 Omniverse 数字孪生平台,通过整合激光雷达数据与 CAD 模型,构建 1:1 还原的工厂、城市虚拟空间,使 AI 能在 “数字镜像” 中预演千万次真实场景操作。
随着 AI 推理对算力需求呈指数级增长(预计为训练阶段的 100 倍),数据中心的能效成为核心瓶颈。
英伟达推出的硅光子技术通过微环谐振器实现光电信号转换,使单端口功耗从传统方案的 30 瓦降至 5 瓦以下,同时支持 512 端口高密度集成。
此技术突破让百万GPU级集群的互联功耗锐减90%,这等同于为每个数据中心节省数十兆瓦的电力。这些节省的能源可额外支持 10% 的算力扩展,直接提升企业的 AI 服务盈利能力。
在网络架构范畴,英伟达凭借Spectrum - X以太网交换机与InfiniBand高速网络占据优势。构建了 “纵向扩展 + 横向扩展” 的混合算力网络:近距离采用铜线互联,远距离依赖硅光子技术。
这种 “因地制宜” 的方案,使全球算力网络既能支持单机架 ExaFLOPS 级的密集计算,也能连接跨洲数据中心形成 “算力联邦”,为自动驾驶训练、气候模拟等超大规模任务提供弹性支撑。
黄仁勋提出未来企业将拥有 “实体工厂” 与 “AI 工厂” 的双轨架构:前者生产物理产品,后者生成驱动产品的数字智能。
全球劳动力预计在2030年将出现达5000万的缺口,劳动力短缺的状况正促使机器人产业迅猛发展,呈现爆发之势。英伟达通过 Grutin 平台与 Isaac Sim 仿真工具,降低了人形机器人的开发门槛。
开发者能够于虚拟环境里训练机器人,使其完成诸如拧螺丝、搬运货物之类的任务,接着凭借数字孪生验证可靠性,最终将其部署至真实场景。
富士康等企业已开始在虚拟工厂中测试数百台机器人协同作业,效率提升 40% 以上。黄仁勋预测,未来十年机器人将成为最大的 AI 应用场景之一,其市场规模将超越消费电子与云计算,成为驱动经济增长的新引擎。
黄仁勋的演讲始终围绕一个核心逻辑:人工智能正从 “辅助人类的工具” 进化为 “理解世界的伙伴”。无论是能动型 AI 的自主推理,还是物理 AI 的环境交互,本质上都是在赋予机器 “认知 - 决策 - 行动” 的完整能力链。
而英伟达通过芯片、软件、生态的协同创新,正在构建一个 “通用 AI 基础设施”, 它不仅提供算力,更定义了人与机器协作的新范式。
来源:波波百谈