摘要:周四,随着德国斯图加特大学(University of Stuttgart)的高性能计算中心(HLRS)宣布其最新的超级计算机Hunter构建完成,数百个AMD APU正式激活。
周四,随着德国斯图加特大学(University of Stuttgart)的高性能计算中心(HLRS)宣布其最新的超级计算机Hunter构建完成,数百个AMD APU正式激活。
这套耗资1,500万欧元的系统由巴登-符腾堡邦科学、研究和艺术部以及德国联邦教育和研究部共同出资,将支持各种公共和私人研究工作,从工程和气象建模到生物医学研究、材料科学,当然还有人工智能(AI)。
Hunter由惠普企业(Hewlett Packard Enterprise,HPE)所打造,采用Cray EX4000平台,并由AMD Instinct MI300A加速处理单元(APU)和Epyc Genoa CPU组成。
如果这个配置听起来有点熟悉,那是因为这台机器和1.74 exaFLOP的El Capitan超级计算机采用相同的架构,只是规模小得多。
El Capitan搭载44,544个APU,而Hunter仅在188个水冷式节点上配备752个APU。 这些加速器每个都拥有24个Zen 4核心、6个CDNA 3 GPU区块和128GB的同调HBM3内存。 除了APU之外,还配备了额外512个32核心Epyc处理器。
HLRS估计Hunter的双精度浮点运算理论峰值性能为48.1 petaFLOPS,几乎是其前身Hawk的两倍。 然而,这适用于需要高精度的科学工作负载。 该大学还计划将该系统应用于各种AI应用,包括模型训练,MI300A的BF16和FP8数据类型应可提供736 petaFLOPS到1.47 exaFLOPS的峰值性能,具体取决于精度。
事实上,在公私合作伙伴关系下,HLRS表示,德国AI创业公司Seedbox.ai已经在使用该系统以24种欧洲语言训练开放式大型语言模型(LLM)。
HLRS主任麦可‧雷许(Michael Resch)在一份声明中表示:“AI的快速发展,以及超级运算领域对可持续发展性的日益重视,意味着高性能计算目前正经历一个令人兴奋的转型期。”
谈到可持续发展性,Hunter的一个独特功能是与HPE合作开发的全新“动态功率限制”功能。 此功能旨在通过持续监控应用程序并根据需求调整功率分配来优化系统的能源效率。 在Hawk超级计算机上的早期测试显示,此功能可在性能没有显著下降的情况下,将功耗降低20%。
虽然48 petaFLOPS的性能让Hunter无法进入Top500的前10名,但这不是它主要的目的。 Hunter是一个过渡系统,主要的目的是帮助研究人员为APU和GPU编写和优化程序代码,以应对更大规模的超级计算机Herder的到来。
与Hunter相同,Herder将由HPE的Cray部门制造,并采用基于GPU的架构,其双精度浮点运算性能估计可达“数百petaFLOPS”。 这两个系统的总成本为1.15亿欧元。
预计近期将开始建造Herder的外壳和电力设施,并于2027年的某个时间点安装完成的系统。
来源:十轮网