One RL to See Them All?一个强化学习统一视觉-语言任务! 强化学习 (RL) 显著提升了视觉-语言模型 (VLM) 的推理能力。然而,RL 在推理任务之外的应用,尤其是在目标检测 和目标定位等感知密集型任务中的应用,仍有待深入探索。 视觉 语言 rl iou vit 2025-05-27 14:12 4