摘要:去年10月,AMD在“Advancing AI 2024”直播活动中,正式发布了Instinct MI325X。据TomsHardware报道,今年的CES 2025上,AMD除了推出了一系列消费端产品,还展示了Instinct MI325X,这是目前唯一一款
去年10月,AMD在“Advancing AI 2024”直播活动中,正式发布了Instinct MI325X。据TomsHardware报道,今年的CES 2025上,AMD除了推出了一系列消费端产品,还展示了Instinct MI325X,这是目前唯一一款配备256GB HBM3E的AI加速器,有望成为最高效的推理GPU之一。
Instinct MI325X属于AMD CDNA 3架构产品的一部分,是一款纯GPU加速器,拥有304个计算单元,共19,456个流处理器,提供了1.3 Petaflops的FP16和2.61 Petaflops的FP8计算性能。其改用容量更大、速度更快的新款HBM3E,总容量从Instinct MI300X的192GB提升到256GB,对应带宽也从5.3TB/s提高到6TB/s。
其实AMD最初的设计是配备288GB HBM3E,传闻使用的内存模块遇到了一些问题,所以最后选择改为256GB。理论上,更大的板载内存对于AI加速器至关重要,无论是用于训练还是推理。现代AI模型通常具有数百亿个参数,需要数万个GPU进行训练,存储这些参数和中间数据等需要大量内存。如果没有足够大的板载内存,开发人员必须采用模型并行或张量切片等技术,这会增加计算和通信开销。
按照AMD的安排,今年下半年会引入Instinct MI355X,采用新一代的CDNA 4架构和3nm工艺制造,搭配HBM3E总容量就爱那个提升到288GB,对应带宽提高到8TB/s,TDP也上升到1000W。其提供了2.3 Petaflops的FP16和4.6 Petaflops的FP8计算性能,提升幅度约为77%。另外还将支持新的数据类型,包括FP4和FP6。
来源:超能网