多模态大模型如何突破模态与任务限制?(哈工大SCIR) 不断发展的多模态大语言模型(MLLMs)展现了实现通用人工智能的潜力,其通过将大语言模型与特定模态的预训练模型结合,扩展了单一非语言模态的理解与生成能力,例如视觉MLLMs、音频MLLMs和3D-MLLMs。然而,这些特定模态MLLMs(Specific-ML 模型 模态 哈工大 哈工大scir scir 2025-04-19 07:08 2