华为云:CloudMatrix384突破大模型训推瓶颈,加速行业智能化跃迁
6月21日,华为开发者大会2025期间,以“CloudMatrix384昇腾AI云服务,算力聚变加速行业AI创新”为主题的高峰论坛顺利举办,四位来自不同领域的AI先行者,与近200位开发者深度对话,从技术内核到场景落地,全面解析基于CloudMatrix384
模型 华为 智能化 刘赫 cloudmatrix384 2025-06-24 16:37 6
6月21日,华为开发者大会2025期间,以“CloudMatrix384昇腾AI云服务,算力聚变加速行业AI创新”为主题的高峰论坛顺利举办,四位来自不同领域的AI先行者,与近200位开发者深度对话,从技术内核到场景落地,全面解析基于CloudMatrix384
模型 华为 智能化 刘赫 cloudmatrix384 2025-06-24 16:37 6
CloudMatrix384是一个超节点(Super Node),相当于一台超级“服务器”。它搭载了384颗华为昇腾NPU和192颗鲲鹏CPU,单卡推理吞吐量可以达到2300 Tokens/s。同时,推理的时延也得到了极大降低,原来100ms的增量Token输
云服务 cloudmatrix384 华为cloudmatr 2025-06-20 17:29 6