小模型逆袭屠榜!30倍数据效率+13倍模型压缩效果暴增近10%! 亮点直击新发现:旨在解决由编辑指令与原始-编辑图像对之间错位引起的噪声监督问题,这是先前工作忽视的根本性问题,如下图2所示。修正监督:利用扩散生成先验指导视觉语言模型,为原始-编辑图像对生成更匹配的编辑指令。强化监督:引入基于三元组损失的对比监督,使编辑模型能 模型 图像编辑 文生 先验 vlm 2025-05-17 01:03 4