扩散语言模型真的会比自回归好?理论分析结果可能恰恰相反 本工作来自北京大学智能学院贺笛老师课题组与蚂蚁集团武威团队。贺笛老师在机器学习领域获得过多项荣誉,包括 ICLR 2023 杰出论文奖与 ICLR 2024 杰出论文奖提名。 模型 语言 mdm 掩码 贺笛 2025-06-10 17:53 2