中信建投 | 华为发布Pangu Ultra MoE 模型中文技术报告
华为盘古团队发布了 Pangu Ultra MoE 模型架构与训练方法的中文技术报告,披露了模型的细节,其核心突破在于实现了“全栈国产化”——完全基于昇腾AI计算平台训练,参数量达7180亿,是中国首个自主可控的超大规模稀疏混合专家模型(MoE)。这一成果标志
华为盘古团队发布了 Pangu Ultra MoE 模型架构与训练方法的中文技术报告,披露了模型的细节,其核心突破在于实现了“全栈国产化”——完全基于昇腾AI计算平台训练,参数量达7180亿,是中国首个自主可控的超大规模稀疏混合专家模型(MoE)。这一成果标志
Pangu Ultra MoE是一个全流程在昇腾NPU上训练的准万亿MoE模型。最近华为盘古团队发布了Pangu Ultra MoE模型架构和训练方法的技术报告[1],进一步披露了这个模型的细节。
ultra moe panguultra pangu 2025-05-30 03:52 2
Pangu Ultra MoE 是一个全流程在昇腾 NPU 上训练的准万亿 MoE 模型,此前发布了英文技术报告[1]。最近华为盘古团队发布了 Pangu Ultra MoE 模型架构与训练方法的中文技术报告,进一步披露了这个模型的细节。
ultra moe ult panguultra pangu 2025-05-29 14:02 3