小米大模型团队音频推理突破,一周登顶MMAU榜,GRPO算法显神威! 小米大模型团队近日宣布,在音频推理技术方面取得了显著进步。该团队受DeepSeek-R1项目的启发,成功将强化学习算法应用于多模态音频理解任务,这一创新实践仅耗时一周,便在国际权威的MMAU音频理解评测中取得了64.5%的准确率,成功登顶榜首,并且已经同步开源 推理 算法 音频 grpo grpo算法 2025-03-18 04:30 3