昇腾大规模专家并行技术解码 —— All to All 通信优化 随着DeepSeek火爆全网,混合专家(Mixture of Experts, MoE)技术也成功出圈。凭借优秀的性能,MoE成为大语言模型(LLM)界的顶流。在各行各业加速接入国产开源大模型DeepSeek的同时,人工智能领域大范围落地应用也带来了庞大的算力 通信 moe const decode acltensor 2025-04-09 21:32 3