UALink 1.0规范发布:支持连接1024个加速器,每通道200GT/s带宽

B站影视 电影资讯 2025-04-09 10:06 1

摘要:去年AMD、博通(Broadcom)、思科(Cisco)、谷歌(Google)、Hewlett Packard Enterprise (HPE)、英特尔(Intel)、Meta和微软(Microsoft)宣布成立Ultra Accelerator Link (

去年AMD、博通(Broadcom)、思科(Cisco)、谷歌(Google)、Hewlett Packard Enterprise (HPE)、英特尔(Intel)、Meta和微软(Microsoft)宣布成立Ultra Accelerator Link (UALink)联盟,共同制定一项新的行业标准,致力于推进数据中心中扩展AI系统的高速和低延迟通信。随后苹果、阿里云、以及Synopsys加入,被选为UALink联盟董事会新成员。

UALink联盟宣布,正式发布UALink 1.0规范,意味着小组成员现在可以对支持新技术的芯片进行流片。其允许在一个计算集群(Pod)内,让接入的GPU等加速器附带的内存之间实现直接加载和存储,提升共同完成大规模计算任务的效率。

UALink协议栈包括四个硬件优化层,分别是物理层、数据链路层、事务层和协议层。其中物理层使用标准以太网组件(例如200GBASE-KR1/CR1),并包括使用FEC减少延迟的修改;数据链路层将事务层的64字节的数据打包成640字节的单位,应用CRC和可选的重试逻辑,另外还负责处理设备间的消息传递;事务层实现压缩寻址,在实际工作负载下以高达95%的协议效率简化数据传输。针对现代数据中心使用,还集成了安全和管理功能,计算集群将通过专用控制软件和固件代理,使用PCIe和以太网等标准接口进行管理。

UALink 1.0规范支持每通道200 GT/s的双向数据速率,信号速率为212.5 GT/s,以适应前向纠错和编码开销。UALink可以配置为x1、x2或x4通道,其中四通道链路在发送和接收方向的速度最高可达800 GT/s。

单个UALink 1.0系统支持连接多达1024个AI加速器,通过UALink交换机连接,每个AI加速器分配一个端口和一个10-bit唯一标识符,以实现精确路由。UALink 电缆长度经过优化,长度小于4米,在64B/640B有效载荷下实现小于1µs的往返延迟。此外,这些链路支持跨一到四个机架的确定性性能。

在外界看来,UALink联盟的创立就是为了改变英伟达在人工智能芯片领域一家独大的格局,竞争目标是称为“NVLink”的互连通信协议。UALink 1.0规范允许在连接到处理器的内存之间直接传输数据,这对于AI训练工作负载尤其重要。

来源:超能网

相关推荐