SuperCLUE 多模态视觉评测榜：文心 4.5 Turbo 总分并列国内第一

摘要：中文多模态视觉语言模型测评基准（SuperCLUE-VLM）8 月榜单正式发布，百度 ERNIE-4.5-Turbo-VL 多模态大模型以 66.47 分的成绩并列位居国内模型第一，在真实场景任务下的领先优势明显。

8 月 29 日消息，中文多模态视觉语言模型测评基准（SuperCLUE-VLM）8 月榜单正式发布，百度 ERNIE-4.5-Turbo-VL 多模态大模型以 66.47 分的成绩并列位居国内模型第一，在真实场景任务下的领先优势明显。

本次评估覆盖 Claude-Opus-4.1、Gemini-2.5-Pro、GPT-5 (high)、ERNIE-4.5-Turbo-VL、Doubao-Seed-1.6-thinking、hunyuan-t1-vision、Qwen-V1-Max-Latest 等国内外 15 款多模态模型。基于中文场景特点，SuperCLUE-VLM 围绕基础认知、视觉推理和视觉应用三大核心维度进行评测，全面考察模型在真实任务场景下的能力。

测评结果显示，Gemini-2.5-Pro 以总分 74.99 分领先，OpenAI GPT-5 (high) 以总分 68.59 分位居第二，百度 ERNIE-4.5-Turbo-VL-32k-preview 以总分 66.47 分并列国内模型第一。有分析人士点评，文心大模型在多模态领域的多维度领先优势十分突出。ERNIE-4.5-Turbo-VL 等国内其他头部模型在视觉推理、视觉应用等高阶任务上的显著进步，凸显了中国在多模态大模型领域的竞争潜力。

SuperCLUE-VLM 多模态视觉语言基准评测总榜

据早前公开报道，6 月 30 日百度开源文心 4.5 系列 10 款模型，其中 ERNIE-4.5-VL 视觉语言模型（ERNIE-4.5-VL-28B-A3B；ERNIE-4.5-VL-424B-A47B）具备复杂的图文与视频理解能力，支持超过 100 种语言交互，其跨模态能力覆盖文档处理、视频管理、学习解题等核心任务场景。

作为国内最早投入大模型产研的企业，百度依托“芯片-框架-模型-应用”的全栈自研体系，持续推动文心大模型能力进化。得益于飞桨文心的联合优化，文心大模型的能力拓展和效率提升。截至目前，飞桨文心开发者数量已超过 2185 万，服务超过 67 万家企业，创建的模型达到 110 万。

来源：新浪财经

标签：模态文心评测视觉 turbo

本文地址：http://news.43b.com.cn/a/839872.html

免责声明：本站系转载，并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题，请在30日内与本站联系，我们将在第一时间删除内容!