NVIDIA解剖GB10超级芯片

B站影视 电影资讯 2025-08-27 11:10 1

摘要:NVIDIA 最近发布了搭载 Blackwell GPU 的 GB10 超级芯片,该芯片驱动多台 DGX AI Mini 超级计算机,如 DGX Spark。这一进展标志着 AI PC 领域的重要突破,吸引众多公司推出自己的 GB10 “AI PC” 平台。G

NVIDIA 最近发布了搭载 Blackwell GPU 的 GB10 超级芯片,该芯片驱动多台 DGX AI Mini 超级计算机,如 DGX Spark。这一进展标志着 AI PC 领域的重要突破,吸引众多公司推出自己的 GB10 “AI PC” 平台。GB10 超级芯片集成了多项数据中心技术,设计紧凑且高效,支持高达 2000 亿参数的大型 AI 模型,并具备灵活的部署配置。其规格包括一个基于 ARM 架构的 20 核 CPU 和 GB100 Blackwell 架构的 GPU,提供高性能计算能力。GB10 还支持多种连接性选项和扩展性,能够互连多个芯片以满足更大 AI 模型的需求。未来,GB10 可能会进入消费市场,如笔记本电脑和 Mini PC。

NVIDIA 最近详细介绍了其 GB10 超级芯片,该芯片配备 Blackwell GPU,驱动着多台 DGX AI Mini 超级计算机。其中,NVIDIA 的 DGX Spark 是首批使用 GB10 超级芯片的系统之一,标志着其在“AI PC”领域的重要进展。在此公告之后,许多公司纷纷推出了自己的 GB10 “AI PC” 平台。今天,在 2025 年热芯片会议上,NVIDIA 正在深入探讨 GB10 超级芯片及其为 Mini 开发者和工作站扩展 Blackwell 架构的能力。

DGX Spark 的目标是设计一款基于 Blackwell 架构的 Mini AI 超级计算机。为此,NVIDIA 开发了 GB10 超级芯片,它将来自数据中心的创新,如 NVFP4、CUDA、SLANG、TensorRT、vLLM、CX-7 NIC、NVLINK C2C、TMEM 等,整合到一个紧凑的 PC 平台中。这得益于多芯片封装技术、低功耗的 C2C 接口以及统一内存架构 (UMA)。因此,DGX Spark 工作站应运而生,提供的功能包括:

GB10 Grace Blackwell 超级芯片:加速 AI、数据科学、计算、渲染和可视化。128GB 统一系统内存:支持高达 2000 亿参数的大型 AI 模型,微调模型能达到 700 亿参数。ConnectX-7 网络:允许两台 DGX Spark 系统处理高达 4050 亿参数的模型。DGX 基础操作系统和 NVIDIA AI 软件栈:促进从 DGX Spark 到 DGX Cloud 或任何加速的数据中心或云基础设施的无缝工作负载转换。灵活的部署配置:可以配置为 AI 工作站或网络连接的个人 AI 云。紧凑且高效的设计:轻松放置于任何桌面,由标准墙面插座供电。

深入了解 GB10 超级芯片的规格,它由两个小芯片组成:S-Dielet,其中包含 CPU 和内存子系统,以及 G-Dielet,包含 GPU 核心。这些小芯片通过先进的 2.5D 封装技术结合在一起,并采用 TSMC 的 3nm 工艺技术制造。CPU 架构基于 ARM Arch v9.2,具有 20 个核心,分为两个 10 核心的簇,每个簇配备私有 L2 缓存和共享 16 MB L3 缓存,总计 32 MB。

GPU 基于 GB100 Blackwell 架构,作为集成 GPU (iGPU) 运行,因为它共享相同的封装和硅片。它配备第五代 Tensor Cores,支持 DLSS 4 和 RTX 光线追踪核心,提供高达 31 TFLOPs 的 FP32 性能和 1000 TOPS 的 NVFP4 计算能力,适用于 AI 工作负载。此外,GPU 还包括额外的 24 MB L2 缓存。NVIDIA GB10 超级芯片 SoC 的内存系统支持 256 位 LPDDR5x (UMA),速度可达 9400 MT/s,能够实现高达 301 GB/s 的原始带宽和最大 128 GB 的容量。

在连接性方面,NVIDIA GB10 超级芯片 SoC 配备 PCIe、USB 和通过 PCIe 的以太网,支持高达四个并发显示器(三个 DisplayPort + 一个 HDMI)在 4K 分辨率下以 120Hz 刷新率显示,支持 HDMI 2.1a 在 8K 分辨率下以 120Hz 刷新率显示。安全性增强包括双安全根支持、SROOT 处理器、OSROOT 处理器,以及与 fTPM 和离散 TPM 的兼容性。整个芯片的热设计功耗 (TDP) 为 140W。

可扩展性是 GB10 超级芯片的另一个令人兴奋的方面。多个 GB10 芯片可以通过 NVIDIA 的 ConnectX 技术互连,以增加吞吐量、带宽和 DRAM 容量,以适应更大的 AI 模型。ConnectX NIC 通过 PCIe Gen5 x8 接口连接到 GB10 SoC,促进通过以太网的通信。NVIDIA 将 GB10 超级芯片 SoC 视为与 Mediatek 成功合作的成果,因为 CPU IP 来源于 Mediatek。对 GPU 内存流量进入 Mediatek 内存子系统的广泛性能建模为该芯片的成功做出了贡献。

展望未来,GB10 超级芯片有望进入笔记本电脑和 Mini PC 等消费平台。报告显示,N1X 和 N1 SoC 可能是首批面向消费者的 NVIDIA SoC,而 GB10 则提供了对这些芯片未来可能提供的功能和特性的初步了解。

来源:老孙科技前沿

相关推荐