PCIe 6.2 + CXL 3.1,突破AI性能界限

B站影视 电影资讯 2025-05-21 17:03 1

摘要:现有的AI技术要想实现电影中看到的所有AI,需要克服计算需求、海量数据传输、实时处理、内存使用等方面的限制。现有的计算架构完全依赖于 PCI Express (PCIe) 互连,难以跟上 AI 工作负载的快速发展。现在,最新一代Compute Express

内存瓶颈造成现有AI工作负载性能低下的 40%。

现有的AI技术要想实现电影中看到的所有AI,需要克服计算需求、海量数据传输、实时处理、内存使用等方面的限制。现有的计算架构完全依赖于 PCI Express (PCIe) 互连,难以跟上 AI 工作负载的快速发展。现在,最新一代Compute Express Link(CXL)标准CXL 3.1已经问世,为内存和资源分配提供了新的方法。

CXL 技术是一种新型的高速互联技术,旨在提供更高的数据吞吐量和更低的延迟,以满足现代计算和存储系统的需求。它最初由英特尔、AMD和其他公司联合推出,并得到了包括谷歌、微软等公司在内的大量支持。

CXL的目标:解决CPU和设备、设备和设备之间的内存鸿沟。服务器有巨大的内存池和数量庞大的基于PCIe运算加速器,每个上面都有很大的内存。内存的分割已经造成巨大的浪费、不便和性能下降。CXL就是为解决这个问题而诞生。

半导体行业协会 (SIA) 的一项研究发现,内存瓶颈造成现有 AI 工作负载性能低下的 40%。 CXL 目前旨在通过实现可被多个处理单元访问的共享内存池来缓解这个问题。

CXL 3.1将重新定义内存的访问和共享方式,而不仅仅是增加带宽。 CXL 支持跨 CPU、GPU 和加速器的动态内存池,从而使 AI 系统能够更有效地优化资源。这种方法有几个重要的好处:

消除内存瓶颈:AI模型需要大量的内存资源,这往往会导致现有架构效率低下。 CXL 3.1 使用共享内存模型来减少延迟并最大限度地提高利用率。降低功耗:CXL 将 AI 工作负载集中在所需的内存上,最大限度地减少不必要的功耗,从而实现更节能的 AI 训练和推理。人工智能应用的无缝扩展:灵活的内存共享架构使人工智能开发人员能够构建更复杂的模型,而不受 CPU/GPU/DPU 中现有内存层次结构的限制。

虽然 CXL 彻底改变了内存管理,但 PCIe 对于高速数据传输仍然至关重要。 PCIe 5.0提供高达128GB/s的双向带宽,确保AI应用的高速数据交叉。随着 PCIe 6.2 的创新以及混合方法的运用,这些数据传输速度预计将进一步提高。

CXL 和 PCIe“混合使用”图像

通过在集成解决方案中使用 PCIe 6.2 和 CXL 3.1,您可以灵活地利用这两种标准的优势。这种混合方法对于复杂的人工智能系统特别有益,因为它可以实现快速的数据移动、高效的内存共享和面向未来的基础设施。

PCIe 6.2 提供超快的数据传输速度,确保 AI 加速器能够毫不延迟地接收所需的数据。 CXL 3.1 允许多个处理单元动态访问共享内存池,从而实现更高的内存利用率。该混合交换机能够在单个片上系统 (SoC) 上支持 PCIe 6.2 和 CXL 3.1,从而实现下一代 AI 工作负载的无缝升级和可扩展性。

下一代支持 CXL 的芯片能够通过支持 AI 加速器和内存池之间的直接通信来彻底改变 AI 驱动的计算,从而大幅提高效率。这种互连减少了数据移动瓶颈并实现了智能内存分配,从而使人工智能模型能够处理信息并适应不断变化的工作负载。下一代 CXL 3.1/PCIe 6.2 技术超越现有架构,释放新功能并支持需要极高效率和实时决策的应用程序。

这些即将到来的创新使自学习人工智能模型的潜力比以往任何时候都更接近优化工作负载分配和计算资源分配,让人想起好莱坞人工智能。利用这些创新,人工智能将能够:

无缝内存/计算集成:未来的 CXL 芯片将为 AI 架构提供更强互联和更灵活的内存层次结构,从而减少与现有结构相关的延迟。动态工作负载适应:现在,借助支持下一代 CXL 的内存共享,AI 工作负载可以在不同的硬件加速器之间流畅地扩展,从而提高整体效率和吞吐量。降低功耗:按需分配内存和优化AI推理工作负载的能力可显著降低能耗,使AI系统更具可持续性,并使其能够在边缘运行而不受功率限制。

“好莱坞级”的人工智能即将成为现实,但我们需要基础设施来跟上其快速的发展。通过结合最新的 PCIe 6.2 高速数据传输和 CXL 3.1 内存池功能,AI 系统可以实现前所未有的效率、可扩展性和性能水平。这些技术为人工智能架构奠定了基础,有可能在机器学习和计算效率方面开辟新天地。

*声明:本文系原作者创作。文章内容系其个人观点,我方转载仅为分享与讨论,不代表我方赞成或认同,如有异议,请联系后台。

想要获取半导体产业的前沿洞见、技术速递、趋势解析,关注我们!

来源:半导体产业纵横一点号

相关推荐