摘要:今日,英伟达创始人兼CEO黄仁勋发表台北国际电脑展COMPUTEX 2025开幕演讲,公布了英伟达制造过的“最大产品之一”——中国台湾新办公大楼NVIDIA Constellation,设在台北的北投士林。
详解Blackwell芯片生产全流程,英伟达再扩AI和机器人生态影响力。
作者 | ZeR0
编辑 | 漠影
芯东西5月19日报道,今日,英伟达创始人兼CEO黄仁勋发表台北国际电脑展COMPUTEX 2025开幕演讲,公布了英伟达制造过的“最大产品之一”——中国台湾新办公大楼NVIDIA Constellation,设在台北的北投士林。
英伟达还宣布与鸿海、中国台湾科技委员会、台积电联合打造AI基础设施,为中国台湾AI生态系统提供支持。
英伟达与富士康鸿海科技集团合作打造一台巨型AI超级计算机,将采用英伟达GB300 NVL72机架式解决方案,搭载10000张英伟达Blackwell GPU。
台湾科技委员会将利用AI超算,为中国台湾科技生态系统提供AI云计算资源。台积电研究人员计划利用该系统推进其研发,性能比上一代系统将提高几个数量级。
大型AI基础设施建设,是今日演讲的重头戏。
黄仁勋穿着标志性的黑皮衣,一路小跑上台,说今天他的爸爸妈妈也在观众席。
一大重磅发布是NVLink Fusion半定制AI基础设施,向外部芯片敞开了允许接入英伟达NVLink机架式系统的大门。这意味着构建AI系统,不必全用英伟达的芯片产品,而是可以搭配使用其他企业的定制CPU和AI芯片。
富士通、高通都是其定制CPU合作伙伴。今日,高通宣布将开发定制数据中心CPU,可接入英伟达机架式架构,实现与英伟达GPU的快速通信。
黄仁勋还晒出美国AI数据中心项目“星际之门”的进展:超过4万平方米,可扩展至1.2GW。“买得越多,做到得越多!”黄仁勋说,这就是构建AI工厂的原因。
总体而言,黄仁勋重点分享了在AI工厂、AI agents、机器人技术等方面的最新进展。
他回顾了英伟达从GPU芯片到的AI基础设施转型历程:2006年介绍CUDA并行计算软件平台和编程模型;2016年推出DGX-1超级计算机,被赠予首台DGX-1的非营利性公司OpenAI开启了AI新革命;2019年/2020年收购Mellanox,将整个数据中心转换成一个计算单元。
“十年后回头看,你会看见AI融入一切。”黄仁勋说,就像互联网,就像生产电力需要工厂,AI需要生成tokens的AI工厂。他预言AI基础设施产业的市场规模将达到数万亿美元。
加速计算始于CUDA-X GPU加速库,覆盖、计算光刻、计算辅助工程、决策优化、数据科学与处理、深度学习、量子计算等。这些库让开发者更易利用CUDA的功能并从英伟达平台获得高性能,从而加速应用。
台积电、Cadence 、KLA、西门子、新思科技正在采用英伟达CUDA-X和Blackwell平台推动芯片设计和制造的发展。
GeForce改变了AI,AI又反过来改变GeForce。英伟达Grace Blackwell由台积电代工生产,反过来台积电将采用Grace Blackwell来推进芯片制造。
在电信行业,英伟达与软银、T-Mobile、诺基亚、三星、富士通、思科等生态伙伴合作,基于AI构建6G;在量子计算领域,英伟达构建混合量子-GPU计算。
代理式AI(Agentic AI)基于“理解-思考-行动”循环,所需的计算量是单范例提示(One-Shot)的100倍~1000倍。物理AI是理解世界的AI,机器人革命的基石。通用机器人将开启下一个万亿美元产业。
01.
GB200全面投产,GB300今秋上市,
详解Blackwell芯片生产全流程
Grace Blackwell NVL72是一个集成了36张英伟达Grace CPU和72张Blackwell GPU的机架级系统,用于加速AI训练和推理。
它展示了英伟达纵向扩展(Scale up)的能力,相当于“一颗巨型GPU”。
横向扩展(Scale out)是指将计算机连在一起。黄仁勋说,Scale out很简单,Scale up很难。构建更大的计算机超出半导体物理学的极限,而Grace Blackwell做到了。
GB200系统已全面投产。相同的体系结构、物理占用空间、电气机械条件,将于今年第三季度可升级成GB300 Grace Blackwell芯片。
相比GB200,GB300的AI推理性能提高到1.5倍,还实现了1.5倍的HBM和2倍的网络互连速率。
新系统一个节点的性能,就能匹敌2018年的整台Sierra超级计算机(有18000张GPU),也就是6年内将性能提高4000倍。
Blackwell不仅是一个科技、工程奇迹,更是中国台湾科技生态系统卓越成就的证明。从晶圆上蚀刻第一个晶体管,到销紧Blackwell机架的最后一颗螺丝,每个步骤都承载着合作伙伴的贡献。
它最初是台积电的一片空白硅晶圆,在一片12英寸晶圆上,经历数百道的晶圆处理和紫外光微影步骤,逐层构建2000亿颗晶体管,晶圆被划线切割成个别的Blackwell裸晶粒(die)。经过测试和分类,良品晶粒被挑选出来,进入后续制程。
在台积电、矽品与艾克尔执行的CoWoS封装中,32颗Blackwell晶粒与128组HBM堆叠,被接合在一片定制化硅中介层晶圆上。蚀刻在其中的金属互连线,将Blackwell GPU与HBM堆叠连接到每个SIP单元中,最后加热、模塑并固化,形成Blackwell B200超级芯片。
在京元电子,每颗Blackwell芯片都会在125摄氏度的烤箱中,进行数小时压力测试。在鸿海,机器夜以继日地将超过1万个零部件精准地放置在Grace Blackwell PCB上。
同时,全球各地工厂也在准备其他零部件。酷码、奇鋐、双鸿、台积电提供的定制化液冷铜制散热器让芯片保持最佳温度。
在另一件鸿海厂房制造的ConnectX-7 SuperNIC用来实现横向扩展的通信能力。加上BlueField-3 DPU来卸载并加速网络、存储等工作。
这些零部件精心得整合进GB200运算托盘。
英伟达NVLink是一项突破性高速互连技术,可连接多个GPU,扩展成一个巨大的虚拟GPU。NVLink交换机托盘由NVLink交换芯片构成,提供14.4TB/s的全互连带宽。
NVLink主干形成了一个定制化的盲插背板,整合了5000条铜缆,提供130TB/s的全互连带宽,这将所有72张Blackwell芯片(144颗GPU晶粒),连成了一个巨大的GPU。
从世界各地来的组件运抵鸿海、纬创、广达、戴尔、华硕、技嘉、慧与、美超微及其他合作伙伴手中,由技术人员组装成机架级规模的AI超级计算机GB200 NVL72,总计有120万个零部件、130万亿颗晶体管,重量高达1800公斤。
02.
英伟达敞开生态大门,能与定制CPU、AI芯片混搭!助攻灵活构建AI工厂
英伟达一直致力于开发全栈集成解决方案,并将其技术作为模块化产品提供给客户及合作伙伴,以便灵活构建。其NVL72机架级系统几乎部署在全球所有主要的超大规模AI工厂中。
今日,英伟达发布半定制AI基础设施NVLink Fusion。
NVLink Fusion拥有世界一流的AI性能、经工业验证的纵向和横向扩展生态系统,以及单一可扩展AI工厂架构,支持英伟达芯片与其他定制芯片混搭,能加快AI工厂上市时间,供超大规模企业采用和管理。
该AI基础设施有两种配置:一种是通过NVLink C2C,将定制CPU与英伟达GPU结合到NVLink机架级架构中;另一种是将英伟达Grace CPU与定制AI计算加速器结合。
其定制芯片合作伙伴包括AIchip、Astera Labs、Marvell、联发科,CPU合作伙伴包括富士通、高通,技术合作伙伴包括Cadence和新思科技。
云提供商可使用任何ASIC、英伟达的机架式系统和英伟达端到端网络平台,将AI工厂扩展至数百万张GPU。该网络平台提供高达800Gb/s的吞吐量,并将提供共封装光学器件。
03.
Blackwell全家桶添新:
个人AI超算、AI笔电、AI服务器
英伟达Blackwell产品组合涵盖从桌面到AI工厂,有面向Arm平台的个人AI平台DGX Spark、数据中心解决方案GB200/GB300 NVL72,也有针对x86平台的RTX PRO笔记本电脑、企业数据中心解决方案RTX PRO Blackwell服务器以及先进的AI存储服务器解决方案。
今日,英伟达Blackwell家族增加新成员,包括DGX Spark和DGX Station个人AI超级计算机、RTX PRO笔记本电脑、RTX PRO Blackwell服务器。
1、桌面级AI超算DGX Spark和DGX Station
DGX Spark个人AI超级计算机今夏就会上市。它是全球最小AI超级计算机,采用GB10 Grace Blackwell超级芯片、128GB统一系统内存、ConnectX-7 SmartNIC,AI算力达到1PFLOPS。
黄仁勋举起2016年推出的DGX-1超级计算机(图左)与DGX Spark(图右)作对比,可见DGX Spark有多轻巧。
宏碁、华硕、戴尔、技嘉、惠普、联想、微星等OEM合作伙伴将推出DGX Spark。
DGX Station是针对更严苛AI工作负载设计的桌面AI超级计算机,本地能跑1万亿参数模型,可提供数据中心级性能。
它搭载GB300 Grace Blackwell Ultra超级芯片、784GB统一系统内存、网络速度多达800Gb/s的ConnectX-8 SuperNIC,AI性能达到20PFLOPS。
华硕、戴尔、技嘉、惠普和微星等将在今年晚些时候推出DGX Station。
2、RTX PRO笔记本电脑
英伟达RTX PRO笔记本电脑搭载24GB GDDR7内存、2倍快的内存,AI性能达到1.8PFLOPS,今年5月上市。
英伟达专业GPU一直是企业工作站部署的首选解决方案。RTX技术结合AI、实时光线追踪、高级图形和计算,改变了桌面计算。
英伟达正在更新RTX PRO GPU阵容,覆盖RTX PRO 5000、4000、3000、2000、1000、500系列笔记本电脑GPU,搭载这些GPU的笔记本电脑将于今年夏天从OEM合作伙伴处提供。
3、RTX PRO Blackwell服务器
英伟达RTX PRO Blackwell服务器是面向企业AI和工业AI的计算平台,扩展了Blackwell的性能和能源效率,可加速代理式AI、物理AI、模拟仿真、视觉计算、设计、数字孪生等各种企业工作负载,支持使用英伟达蓝图构建的AI agents和生成式AI应用,即日可订购。
这些新服务器将提供多种NVIDIA认证系统配置,针对英伟达AI软件栈、Spectrum-X以太网网络进行了优化,最多科支持8张RTX PRO 6000 Blackwell服务器版GPU,FP4 AI性能可达30PFLOPS,3PFLOPS RTX图形性能可支持大规模实时Omniverse数字孪生模拟和工业机器人等物理AI应用。
相比H100 HGX服务器,Blackwell服务器运行DeepSeek-R1的性能达到4倍。
04.
助攻企业更快开发AI agents,
挖掘数据知识,提高团队生产力
英伟达企业AI平台正在加速全球IT一万亿美元投资。该平台包含三层:AI基础设施、AIOps、代理式AI。
在企业AI工厂基础设施上部署AI agents的开发人员可利用Dataiku、DataRobot、Dynatrace、JFrog等合作伙伴AIOps工具来构建、编排、运营和扩展AI工作流。
该设计还支持来自CrewAI的框架,以及来自DataStax和Elastic的向量数据库,以帮助agents存储、搜索和检索数据。
借助来自Arize AI、Galileo、SuperAnnotate、Unstructured、Weights & Biases等合作伙伴的工具,开发人员可进行数据标记、合成数据生成、模型评估和实验跟踪。ActiveFence、CrowdStrike、Fiddler、Securiti、Trend Micro等安全合作伙伴的软件可保护AI工厂。
Canonical、Nutanix、Red Hat、VMware等编排和部署合作伙伴支持在复杂的企业环境中无缝扩展和管理AI agents工作负载。
代理式AI改变了企业用数据做决策的方式。比如,VAST仅用3天就利用英伟达AI-Q蓝图与自身的加速AI数据平台,打造出销售研究AI agent,通过NeMo Retriever,该平台持续提取、嵌入和索引数据资料,让语义搜索更快。
过去需要几天才能拟定的销售计划,现在只需一个AI提示词。AI agent会拟定一个销售大纲,接着使用CRM系统、多模态知识库和内部工具等资料,最后用Llama Nemotron将大纲转为逐步销售计划。
英伟达推出经过英伟达企业AI工厂验证的新设计和英伟达AI蓝图,使企业能够构建智能、适应性强的AI Agents,从而提高团队生产力。
新AI蓝图可帮助开发人员构建能说话、研究和学习的智能AI队友,通过理解自然通信和直接访问企业数据,创建符合业务目标的agents,以提高员工工作效率。
全球领先存储系统制造商正推出基于英伟达AI数据平台的产品和解决方案,来支持AI agents。英伟达AI数据平台使用检索增强生成和NeMo检索微服务来访问企业数据,能够为AI agents提供近乎实时的业务洞察。
使用这些解决方案构建代理式AI基础设施,可直接访问企业中许多存储设备中的非结构化数据,帮助企业使用检索增强生成(RAG)软件将数据转化为可操作的知识,为AI agents提供更快更准确的响应。
存储提供商可将他们的文档安全和访问控制专业知识集成到内容索引和检索过程中,从而提高AI推理的安全性和数据隐私合规性。
05.
加速人形机器人开发:
开源基础模型,扩充合成运动数据集
AI agents本质上是数字机器人。英伟达还想制造物理机器人。
机器人要在虚拟世界中学习如何成为一个好的机器人,虚拟世界必须遵循真实世界的物理定律。英伟达与谷歌DeepMind、迪士尼研究院合作研发了世界上最先进的物理引擎Newton,将于7月开源。
物理AI是下一波AI浪潮。英伟达构建了机器人行业所需的3台计算机:
(1)DGX,用Omniverse来训练AI模型;
(2)RTX PRO Blackwell服务器和RTX PRO 6000工作站,用于模拟仿真与合成数据生成;
(3)Jetson AGX,用于机器人运行时。
英伟达已构建全栈软硬件,包括在这些计算机上运行的基础模型、仿真框架和数据管道,以供开发人员加速工作流程。
人形机器人是增长最快的机器人领域之一。英伟达打造了开放式人形机器人开发平台Isaac GR00T。这是面向物理AI合成数据生成、预训练和推理的新AI基础设施。
该平台包括两项重要发布:Isaac GR00T N1.5基础模型和Isaac GR00T-Dreams合成数据生成蓝图。
Isaac Groot N1.5是英伟达开放、通用、完全可定制的人型机器人基础模型的首次更新,它能够更好地适应新的环境和工作空间配置,并在给定指令时更好地识别物体,提高拾取和放置任务的成功率。
此前该模型已被下载6000次,获得3.6K星。新的N1.5模型将于6月9日开源。
开发者可以为特定机器人品牌发布训练模型,并使用英伟达Isaac GR00T-Dreams蓝图生成的合成数据训练Isaac Groot N1.5。
机器人制造商面临的主要挑战是缺乏大规模、真实和合成数据来训练模型。机器人从真实世界的数据中学习,人工示范无法大规模推行,这既昂贵又耗时。开发者可使用英伟达Cosmos物理AI世界基础模型来扩增数据。
英伟达研究团队使用Isaac GR00T-Dreams蓝图生成合成数据,仅用36小时就选练出Isaac Groot N1.5。而如果不用这个蓝图,手动收集这些数据需要花费近3个月。
Isaac GR00T-Dreams是一个基于英伟达Cosmos构建的蓝图,用于生成大规模合成轨迹数据,是一种真实到真实的数据工作流程。这些生成数据可以被用来教机器人适应不断变化的环境,掌握新的行为。
首先,通过记录单一环境中的单一任务进行远程操作的人工演示,开发者可对Cosmos世界基础模型进行微调。
然后,用图像和新的指令提示模型,以生成“梦境(Dream)”,即机器人在新环境中执行新任务的视频,或者说是未来世界的状态。
一旦产生大量“梦境”,Cosmos就会推理并评估每个“梦境”的质量,选择最好的进行训练。
这些“梦境”仍然只是像素。机器人是从动作中学习的,GR00T-Dreams蓝图从3D“梦境”视频片段,生成3D的动作轨迹,然后用它来训练机器人模型。
GR00T-Dreams让机器人能够以少量的人工捕捉,学习大量各种新动作。
因此,一个小型的人类示范团队,就能完成过去需要数千人才能完成的工作。这使得开发者在解决机器人挑战方面又迈进了一步。
最终,机器人可以正确拾取物品,比如让它拿起苹果或罐头。
06.
台积电用Omniverse构建新晶圆厂,
富士康用数字孪生训练机器人
台积电、富士康、纬创、和硕、台达、广达、纬颖、技嘉等中国台湾领先的半导体和电子制造公司使用英伟达Omniverse,为制造过程的每一个步骤开发数字孪生。
他们正在建设晶圆厂和AI工厂的数字孪生,以优化制造过程,这为他们节省了数百万美元的成本。
例如,广达、纬创、和硕在实体动工前,先以虚拟方式规划新厂房和产线,并透过减少停机时间,节省数百万美元的成本。和硕模拟锡膏点胶以减少生产缺陷。
台积电正在与一家AI驱动的数字孪生创企合作,优化其新晶圆厂的规划与建设。台积电利用AI引擎和基于Omniverse库构建的应用程序,将传统的2D CAD图资转化成了整座晶圆厂的丰富交互式3D布局,并在英伟达cuOpt平台上开发AI工具,可模拟和优化跨多楼层的复杂管线系统,进而节省数月时间。
台积电也使用视觉语言模型和视觉基础模型来改进自动缺陷分类工作流程,从而提高对晶圆产品缺陷进行分类的效率,帮助工程师查明问题的潜在根源。
除了使用数字孪生和视觉AI之外,台积电还利用英伟达CUDA-X软件库和GPU来加速其半导体芯片设计工作流程,从使用英伟达cuLitho进行光刻到半导体工艺模拟。
富士康台湾工厂正依靠基于OpenUSD、西门子和Omniverse技术开发的Fii数字孪生平台来设计和模拟机器人工作单元、装配线和整个工厂布局。
此外,富士康使用英伟达Isaac GR00T N1模型、用于生成合成操作动作的Isaac GR00T-Mimic蓝图和Isaac Lab来训练工业机械臂和人形机器人执行拧紧螺丝、拾取和放置、组装、电缆插入等复杂任务。
利用Omniverse蓝图的AI工厂数字孪生,富士康可以在液冷POD中模拟和测试 GB200 Grace Blackwell超级芯片,以复制AI工厂的条件。
为了开发物理AI机器人,多家公司利用数字孪生作为机器人训练场,以开发、训练、测试和模拟这些机器人。
无论是机械臂、自主移动机器人、人形机器人还是视觉AI agents,都可以模拟任务执行,或以团队方式进行多方协作,而且当通过物联网连接到实体孪生时,每个数字孪生都会变成实时互动式仪表板。
和硕借助英伟达Metropolis打造AI agents,以协作员工学习复杂技能。
Linker Vision和高雄市用数字孪生来模拟各种不可预测情境的影响,并打造管理城市里影像串流系统的AI agents,以发送即时通知给第一线应变人员。
07.
结语:全力投身AI基建,
英伟达再扩生态影响力
短短几年,英伟达已发展成为一家市值3万亿美元的公司。当前英伟达正全力投入AI基础设施建设,积极布局下一波企业AI、工业AI、物理AI以及AI4Science浪潮,为下一代AI研发提供各类硬件设备及软件。
英伟达将从AI到机器人的基础设施各阶段拆解,形成灵活、模块化的产品矩阵。随着定制AI芯片阵营日趋壮大,英伟达又适时推出半定制AI基础设施NVLink Fusion,敞开生态大门,此举有望帮助英伟达进一步扩大其数据中心生态及市场影响力。
来源:芯东西