百度ERNIE-4.5-21B-A3B-Thinking开源即登HuggingFace趋势榜首 轻量级模型展现接近顶级智能

B站影视 日本电影 2025-09-12 03:19 3

摘要:在近日举办的WAVE SUMMIT深度学习开发者大会2025上,百度宣布开源其最新研发的思考模型——ERNIE-4.5-21B-A3B-Thinking,这一举措迅速引发了行业内的广泛关注。据国际知名开源平台HuggingFace发布的最新榜单数据显示,截至9

在近日举办的WAVE SUMMIT深度学习开发者大会2025上,百度宣布开源其最新研发的思考模型——ERNIE-4.5-21B-A3B-Thinking,这一举措迅速引发了行业内的广泛关注。据国际知名开源平台HuggingFace发布的最新榜单数据显示,截至9月11日,该模型在文本模型趋势榜上独占鳌头,位列榜首,同时在模型总榜中也跻身前三,展现了强大的技术实力和市场认可度。

ERNIE-4.5-21B-A3B-Thinking作为一款创新性的深度思考模型,其核心亮点在于采用了先进的混合专家(MoE)架构。这一架构使得模型在保持总参数规模达21B的同时,每个token仅激活3B参数,实现了高效与智能的完美平衡。通过精心设计的指令微调及强化学习训练策略,该模型在逻辑推理、数学运算、科学分析以及代码与文本生成等多个领域均取得了显著进步,甚至在部分任务上达到了人类专家的水平。

ERNIE-4.5-21B-A3B-Thinking是在其前代模型ERNIE-4.5-21B-A3B的基础上进一步优化训练而来,不仅继承了前代模型的优秀基因,更在长上下文处理能力上实现了质的飞跃。该模型支持高达128K的上下文窗口,为需要处理复杂推理任务的应用场景提供了强有力的支持。无论是处理冗长的文献资料,还是进行多轮次的对话推理,ERNIE-4.5-21B-A3B-Thinking都能游刃有余,展现出卓越的性能。

ERNIE-4.5-21B-A3B-Thinking还具备高效的工具调用能力,能够自动识别并调用相关工具完成复杂任务,从而实现了任务处理的自动化与智能化。这一特性使得该模型在金融分析、医疗诊断、法律咨询等多个专业领域具有广泛的应用前景。尽管其总参数量仅为21B,激活参数更是低至3B,但ERNIE-4.5-21B-A3B-Thinking在各项测试中的表现却毫不逊色于业界顶级的大尺寸模型,以轻量级的身躯实现了接近SOTA(State-of-the-Art)的智能水平,为深度学习领域的发展注入了新的活力。

来源:ITBear科技资讯

相关推荐