双榜第一!文心最新多模态深度思考模型登顶Huggingface

B站影视 内地电影 2025-11-18 10:38 1

摘要:双榜第一!文心最新多模态深度思考模型登顶Huggingface





11月17日,HuggingFace官网显示,百度最新开源的文心多模态思考模型ERNIE-4.5-VL-28B-A3B-Thinking 登上Huggingface 模型趋势榜全球第一。11日,该模型正式发布并开源,发布次日至今,已连续6天位列Huggingface 多模态模型趋势榜全球第一。

作为文心大模型开源家族的最新成员,ERNIE-4.5-VL-28B-A3B-Thinking基于ERNIE-4.5-VL-28B-A3B训练而来,专注于提升多模态理解和跨模态推理能力。

公开评测数据显示,ERNIE-4.5-VL-28B-A3B-Thinking在多项多模态理解与推理任务中表现优异,仅需3B激活参数,性能表现接近业界领先的GPT-5-High与Gemini-2.5-Pro。

值得关注的是,ERNIE-4.5-VL-28B-A3B-Thinking创新性引入了“图像思考”(Thinking with Images)功能,使其具备更接近人类的认知方式——能够主动放大、缩小图像,聚焦细节,并结合上下文进行多步推理。同时,该模型进一步加强了视觉定位能力,拥有更强的指令遵循能力,在用户需要时,能够便捷的触发视觉定位功能,适用于需要精确空间感知的应用场景。

当前,ERNIE-4.5-VL-28B-A3B-Thinking模型以 Apache License 2.0协议开源,允许商业使用。该模型的预训练权重、推理代码和项目均已在 Hugging Face、Modelscope、飞桨星河社区发布,FastDeploy、vLLM、Transformers 等开源工具已经实现了对该模型的支持,可以直接加载模型并使用。

相关链接:
Hugging Face:
https://huggingface.co/baidu/ERNIE-4.5-VL-28B-A3B-Thinking
GitHub:
https://github.com/PaddlePaddle/ERNIE
星河社区:
https://aistudio.baidu.com/overview
魔搭社区:
https://modelscope.cn/organization/PaddlePaddle
文心大模型技术Blog:

来源:宝藏

相关推荐