摘要:博通今日宣布,一款支持多数据中心规模分布式 AI 工作负载的新型高容量互连设备已正式商用。这款名为 Jericho4 的以太网结构路由器隶属于该公司的 DNX 产品线,据称能够实现可跨 100 公里及以上距离的分布式计算集群。博通设计这款设备的初衷是服务于 A
博通今日宣布,一款支持多数据中心规模分布式 AI 工作负载的新型高容量互连设备已正式商用。这款名为 Jericho4 的以太网结构路由器隶属于该公司的 DNX 产品线,据称能够实现可跨 100 公里及以上距离的分布式计算集群。博通设计这款设备的初衷是服务于 AI 训练和推理工作负载,让原本分散的系统能在区域性数据中心范围内实现统一协同运作。这款新解决方案据称实现了突破单个设施物理限制的计算可扩展性。
以下让我们以深入了解这款新解决方案。
HyperPort 高速互连技术
博通打造的 Jericho4 能够安全互连地理上分散的数据中心内超过 100 万个各类处理器(XPUs),将 AI 计算架构的覆盖范围拓展至单个设施的物理与功率限制之外。
“我们的客户正着眼于数百万个 GPU,” 谢弗表示,“这正是我们助力他们解决的问题。”
每个系统最多支持 36,000 个端口,每个端口通过博通专有 HyperPort 接口可提供 3.2 太比特每秒(Tbps)的带宽 —— 这是一种专为长距离、高吞吐量 AI 数据传输打造的全新架构。
HyperPort 实现 70% 的链路利用率提升HyperPort 基于博通采用 3 纳米工艺节点的 200G PAM4 串并转换器(SerDes)构建,是一种 3.2Tbps 以太网端口,可将 4 个 800G 通道聚合为单一逻辑链路。尽管该设计尚未纳入 IEEE 或 MSA 的标准定义,但每个 HyperPort 在保持以太网数据包完全兼容性的同时,能显著提升带宽效率并减少拥塞。
这一技术针对传统多 800G 端口上的 ECMP 负载均衡方法的缺陷而设计 —— 此类方法因哈希冲突和流量分配不均会导致效率低下,而在 “大象流”(大流量)占主导的 AI 工作负载中,这一问题尤为突出。HyperPort 通过增加有效流量宽度和提升端口级链路利用率来缓解这些问题。博通称,相较于 800GE 方案,其带宽利用率提升高达 70%,这意味着设施间数据传输更快、任务完成时间更短,且无需改动现有光学器件或物理基础设施即可提升整体系统性能。
具备深度缓冲和线速安全性的分布式 RoCE
Jericho4 的一大显著特性是将融合以太网 RDMA(RoCE)的支持范围拓展至 100 公里以上的距离。
在长距离以太网链路上维持无丢包传输,是标准数据中心交换机设计未能解决的难题。
“RoCE 必须做到无丢包,否则就无法正常工作,也就不再是 RoCE 了,” 谢弗表示,“如果不采用像 Jericho 这样的解决方案,长距离支持可能会成为一个致命障碍。”
博通通过基于高带宽内存(HBM)的集成深度缓冲技术解决了这一问题,使路由器能够吸收拥塞,而不会将优先级流控制(PFC)事件扩散到相邻的数据中心域。通过这种方式,Jericho4 能将长距离拥塞影响与本地计算架构隔离开来,确保在突发 AI 工作负载下保持稳定性和吞吐量。
Jericho4 将 RoCE 的部署范围拓展至 100 公里以上
除缓冲和拥塞管理外,Jericho4 还在每个端口集成了线速 MACsec 加密功能,以保障设施间的流量安全。值得注意的是,MACsec 通过硬件实现,不会造成性能损耗,因此无论加密是否启用,吞吐量都保持一致。
以太网兼容性
与专有互连技术不同,Jericho4 遵循超以太网联盟(UEC)的规范,确保能与日益增长的 UEC 兼容网卡(NIC)、交换机和软件栈生态系统协同工作。博通在 HyperPort 接口中保留了以太网数据包结构,以简化与现有软件定义网络栈和监控工具的集成。这为运营者提供了一套跨本地和区域域的统一、基于标准的架构。
这种符合标准的方案也使博通的技术成为未来开放式架构的可扩展基础,尤其当超大规模数据中心运营商寻求通过通用编程和管理框架来统一分布式基础设施时,这一优势更为凸显。
“任何正在开发加速器的企业,现在都可以采用这一规范,在其加速器中集成基于以太网的小芯片(chiplet),从而与任何以太网交换机相连,” 西拉杰表示。
互操作性简化了采购和部署流程,同时降低了供应商锁定风险,这让 Jericho4 对正在制定长期 AI 基础设施路线图的客户具有很强的吸引力。
Jericho4 在博通产品组合中的定位
据博通介绍,Jericho4 与该公司的 Tomahawk 和 Trident 平台形成互补,填补了广域、横向扩展互连的角色空白。Tomahawk Ultra 和 Tomahawk 6 专注于机架内和设施内互连,强调超低延迟和大交换容量,而 Jericho4 则实现设施间连接,同时保持相同的管理模式和路由策略。基于 Jericho4 的完整架构可作为单一逻辑路由器运行,简化了分布式系统的管理复杂性。
Jericho4、Tomahawk6 与 Tomahawk-Ultra 的灵活部署组合
这种统一的架构理念使系统设计人员能根据延迟、规模和地理限制,灵活组合 Tomahawk 和 Jericho 系列产品。博通称,Jericho4 基于相同的核心芯片,可构建容量高达 51.2Tbps 的固定形态或机箱式路由器。该平台还支持灵活的拓扑结构,适用于中央交换平面、模块化架构元件或分布式计算节点互连。
人工智能后单体时代的基础设施
博通将 Jericho4 视为以太网走向成熟的标志 —— 它已成为足以支撑最严苛 AI 工作负载的传输技术。曾经,InfiniBand 或专有架构在横向扩展领域占据主导地位,而博通的 “以太网优先” 战略则为跨 AI 与非 AI 领域的统一基础设施提供了可行路径。
ADC 射频 Wifi 等芯片测试线下技术研讨会
来源:小孙科技观