摘要:MILS包含生成器、评分器两大模块:生成器负责生成候选方案,评分器评估方案质量,通过迭代循环产出高质量解决方案
一种名为MILS的零样本学习新方法横空出世!它能让大语言模型(LLM)看懂图片视频、听懂声音
MILS包含生成器、评分器两大模块:生成器负责生成候选方案,评分器评估方案质量,通过迭代循环产出高质量解决方案
此外,该方法可广泛应用于图像/视频/音频描述、图像生成增强、风格迁移等多模态任务
论文链接:https://arxiv.org/pdf/2501.18096
GitHub代码库:https://github.com/facebookresearch/MILS
来源:胖墩家一点号