英伟达AI以太网平台拿下大客户!支撑Meta和甲骨文大规模AI基建

B站影视 电影资讯 2025-10-13 23:57 1

摘要:刚刚,在圣何塞OCP全球峰会上,英伟达展示了十亿瓦AI工厂的未来,并宣布Meta和甲骨文将使用英伟达Spectrum-X以太网网络交换机来增强其AI数据中心网络,加快大规模部署,实现AI训练效率的指数级增长。

作者 | ZeR0

编辑 | 漠影

智东西10月13日报道,刚刚,在圣何塞OCP全球峰会上,英伟达展示了十亿瓦AI工厂的未来,并宣布Meta和甲骨文将使用英伟达Spectrum-X以太网网络交换机来增强其AI数据中心网络,加快大规模部署,实现AI训练效率的指数级增长。

英伟达创始人兼CEO黄仁勋说,Spectrum-X不仅仅是更快的以太网,更是“AI工厂的神经系统”,使超大规模计算企业能够将数百万张GPU连接到一台巨型计算机中,以训练有史以来最大规模的模型。

专为万亿参数模型时代而设计的英伟达Spectrum-X以太网平台由Spectrum-X以太网交换机和Spectrum-X以太网超级网卡组成,是首个专为AI打造的以太网平台

Spectrum-X以太网已展现出创纪录的效率,其拥塞控制技术使全球最大的AI超级计算机实现了95%的数据吞吐量。相比之下,现成的大规模以太网会遭遇数千次流量冲突,导致吞吐量限制在60%左右。

这一效率飞跃标志着AI可扩展网络在经济性和性能方面的突破。英伟达Spectrum-XGS以太网技术是Spectrum-X以太网网络平台的一部分,能够实现跨规模扩展,将跨城市、国家、大洲的数据中心连接成庞大的十亿级AI超级工厂。

Spectrum-X基于英伟达全栈平台(包括GPU、CPU、NVLink和软件),提供从计算到网络的无缝性能。其先进的拥塞控制、自适应路由和AI驱动的遥测功能可确保大规模AI训练和推理集群的效率和可预测性。

甲骨文将建设通过Spectrum-X以太网互连的十亿级AI工厂。

“通过采用Spectrum-X以太网,我们能以突破性的效率互连数百万张GPU,从而使我们的客户能够更快地训练、部署并受益于下一波生成式和推理式AI。”甲骨文云基础设施执行副总裁Mahesh Thiagarajan说。

Meta将把Spectrum以太网交换机集成到其Facebook开放交换系统(FBOSS)的网络基础设施中。FBOSS是一个专为大规模管理和控制网络交换机而开发的软件平台。此次集成将加速大规模部署,从而提升AI训练效率并缩短洞察时间。

据Meta网络工程副总裁Gaya Nagarajan分享:“Meta的下一代AI基础架构需要业界前所未有的规模的开放高效网络。通过将英伟达Spectrum以太网集成到Minipack3N交换机和FBOSS中,我们可以扩展我们的开放网络方法,同时释放训练更大规模模型所需的效率和可预测性,并将生成式AI应用带给数十亿人。”

英伟达NVLink Fusion也正快速发展,使企业能够将其半定制芯片无缝集成到高度优化且广泛部署的数据中心架构中,从而降低复杂性并加快产品上市时间。

英特尔和三星代工厂正在加入NVLink Fusion生态系统。该生态系统包括定制芯片设计者、CPU和IP合作伙伴,以便AI工厂能够快速扩展,以处理模型训练和Agentic AI推理的苛刻工作负载。

全新NVLink Fusion生态伙伴包括:

CPU合作伙伴:富士通,英特尔,高通。定制芯片合作伙伴:AIchip,Astera Labs,GUC,Marvell,联发科,三星。技术合作伙伴:楷登电子(Cadence),新思科技(Synopsys)。

作为最近宣布的英伟达和英特尔合作的一部分,英特尔将构建使用NVLink Fusion集成到英伟达基础设施平台的x86 CPU。

三星代工厂已与英伟达合作,以满足对定制CPU和定制XPU日益增长的需求,为定制芯片提供从设计到制造的体验。

如今,十亿瓦AI集群已经成为AI芯片龙头企业们共同的目标。英伟达Spectrum-X以太网和Spectrum-XGS结合了OCP的开放性和领先性能,被Meta和甲骨文两大科技巨头选用部署。

这些旨在实现跨规模扩展的技术,将为大规模AI训练及推理带来更可观的效率,进而加速生成式AI应用的开发与普及。

来源:智东西

相关推荐