摘要:据 HuggingFace 官网最新数据显示,截至 2025 年 9 月 12 日,百度最新开源的文心思考模型ERNIE-4.5-21B-A3B-Thinking在 HuggingFace 全球模型总趋势榜和文本模型趋势榜均排名第一。
据 HuggingFace 官网最新数据显示,截至 2025 年 9 月 12 日,百度最新开源的文心思考模型
ERNIE-4.5-21B-A3B-Thinking在 HuggingFace 全球模型总趋势榜和文本模型趋势榜均排名第一。
ERNIE-4.5-21B-A3B-Thinking 采用混合专家(MoE)架构,总参数规模 21B,每个 token 激活 3B 参数,并通过指令微调及强化学习训练而成。ERNIE-4.5-21B-A3B-Thinking 是在 ERNIE-4.5-21B-A3B 基础上训练的深度思考模型,支持 128K 的上下文窗口,适用于需要长上下文的复杂推理任务。该模型不仅在逻辑推理、数学、科学,代码与文本生成等需要人类专家的任务上实现了显著提升,还具备高效的工具调用能力,能够支持复杂任务的自动化处理。
公开资料显示,作为一款总参数 21B、激活仅 3B 的轻量化模型,
ERNIE-4.5-21B-A3B-Thinking 在多项评测中展现出接近业界顶尖大模型的表现,以轻量规模实现了 SOTA 水平的智能能力。
业内人士指出,此次百度文心思考模型登顶HuggingFace不仅展现了模型本身的性能,也体现了其背后的技术生态优势。目前,全球主流顶尖大模型大多依赖 PyTorch 等开源框架训练,而能够依托自研框架跑通顶级模型的厂商,只有谷歌和百度。 文心大模型完全基于百度自研的飞桨深度学习框架训练,这意味着百度不仅在模型层面具备竞争力,更在底层框架上实现了自给自足,形成了全栈自主可控的技术体系。
在此前的 WAVE SUMMIT 深度学习开发者大会 2025 上,百度还正式发布了文心大模型 X1.1 深度思考模型,在事实性、指令遵循、智能体等多方面能力均有显著升级。
来源:科技新维度