舍弃自回归!国内团队打造纯扩散多模态大模型LLaDA-V 此次,团队将 LLaDA 拓展至多模态领域,推出了 LLaDA-V—— 集成了视觉指令微调的纯扩散多模态大语言模型(MLLM) 。这项工作标志着对当前以自回归为主流的多模态方法的一次重要突破,展示了扩散模型在多模态理解领域的巨大潜力。 模型 模态 mlp llada 投影器 2025-05-27 20:10 3