理解能力

加州大学团队:DOVE如何提升AI图像理解能力?

长久以来,我们使用相机捕捉世界的瞬间,无论拍摄的是简单的白墙还是繁忙的街景,每张照片在计算机看来都被强制转换为相同长度的数据表示。这就像是无论你要记录一个简单的购物清单还是整部战争与和平,都被要求使用恰好100个单词一样不合理。加州大学圣地亚哥分校、加州大学伯

编码器 图像 加州大学 理解能力 dove 2025-06-10 21:20  4

用多维精细感知任务解析多模态大语言模型的方向理解能力

多模态大语言模型(MLLMs)近年来在许多视觉-语言任务上取得了令人瞩目的进展,但它们是否真正理解物体的方向性?这个看似简单的问题,实际上关系到机器人操作、自动驾驶和增强现实等众多实际应用。波士顿大学的研究团队于2025年5月发表了一项开创性研究,深入探究了这

模型 模态 语言 理解能力 dori 2025-06-03 16:59  5