重磅!Meta无需训练让LLM获多模态能力

B站影视 港台电影 2025-02-16 20:45 1

摘要:MILS包含生成器、评分器两大模块:生成器负责生成候选方案,评分器评估方案质量,通过迭代循环产出高质量解决方案

一种名为MILS的零样本学习新方法横空出世!它能让大语言模型(LLM)看懂图片视频、听懂声音

MILS包含生成器、评分器两大模块:生成器负责生成候选方案,评分器评估方案质量,通过迭代循环产出高质量解决方案

此外,该方法可广泛应用于图像/视频/音频描述、图像生成增强、风格迁移等多模态任务

论文链接:https://arxiv.org/pdf/2501.18096

GitHub代码库:https://github.com/facebookresearch/MILS

来源:胖墩家一点号

相关推荐