多模态航海图出炉:哈工大团队论文描绘“看听说想”全能AI 为打造真正的原生巨轮,作者提出两大核心能力:一是“多模态代理式推理”。它要求船只能在浪涌突变时实时调帆,通过分层任务拆解、外部工具调用与具身学习,在数字与物理世界间自如穿梭。从 Operater 到 Claude Computer Use,再到 Gemini 模态 论文 哈工大 航海图 模态航海图 2025-05-12 17:48 2