摘要:百度声称这两款模型在多个评测指标上达到了领先水平,在多项第三方基准测试中超越了 DeepSeek 的非推理型 V3 模型和 OpenAI 的 GPT-4.5(注意百度选择的这个相似的命名)。这些测试包括 C-Eval (评估中文大语言模型在 52 个学科领域的
近日,中国搜索引擎巨头百度宣布推出两款新型 AI 模型:多模态语言模型 ERNIE 4.5 和推理模型 ERNIE X1。
百度声称这两款模型在多个评测指标上达到了领先水平,在多项第三方基准测试中超越了 DeepSeek 的非推理型 V3 模型和 OpenAI 的 GPT-4.5(注意百度选择的这个相似的命名)。这些测试包括 C-Eval (评估中文大语言模型在 52 个学科领域的知识和推理能力)、CMMLU (中文大规模多任务语言理解) 和 GSM8K (数学应用题)。
据称,ERNIE X1 的成本比中国新秀 DeepSeek 的 R1 推理模型低 50%,ERNIE 4.5 的成本则比美国 AI 巨头 OpenAI 的 GPT-4.5 低 99%。
然而,这两个模型也存在一些重要限制。ERNIE X1 尚未开源 (而 DeepSeek R1 已开源),ERNIE 4.5 的上下文窗口相对较小 (8,000 tokens,而不是 128,000 tokens,在当今百万级 token 上下文窗口的时代,这个数字显得异常低。Token 是大型 AI 模型表示信息的方式,数量越多意味着可处理的信息越多。128,000 token 相当于一本 250 页的小说)。
正如 X 用户 @claudeglass 在帖子中指出,较小的上下文窗口可能使其仅适用于客服聊天机器人。
百度在 X 平台上表示,计划在 2025 年 6 月 30 日开源 ERNIE 4.5 模型系列。
百度已通过其 API 和中文聊天机器人 "文心一言" (ERNIE Bot) 提供对这些模型的访问。文心一言可以回答问题、生成文本、创作文章,并与用户进行对话交互,目前已免费开放使用。
ERNIE 4.5:新一代多模态 AI ERNIE 4.5 是百度最新的基础模型,作为原生多模态系统,能够处理和理解文本、图像、音频和视频,是 OpenAI 于 2025 年 2 月发布的 GPT-4.5 模型的明显竞争对手。
该模型在理解力、生成能力、推理能力和记忆力方面都进行了优化,包括改进了幻觉预防、逻辑推理和编程能力。
百度表示,ERNIE 4.5 在多项基准测试中超越了 GPT-4.5,同时保持显著较低的成本。
模型的进步源于多项关键技术,包括 FlashMask 动态注意力掩码、异构多模态专家混合系统和自反馈增强后训练。
ERNIE X1:具备工具使用能力的深度思维推理模型 ERNIE X1 引入了先进的深度思维推理能力,强调理解、规划、反思和进化。
与标准多模态 AI 模型不同,ERNIE X1 专门设计用于复杂推理和工具使用,能够执行高级搜索、基于文档的问答、AI 生成图像解释、代码执行和网页分析等任务。
该模型支持多种工具,包括百度学术搜索、商业信息搜索和加盟研究工具。其开发基于渐进式强化学习、集成思维链和行动链的端到端训练,以及统一的多方面奖励系统。
访问和 API 可用性 用户现可通过文心一言官方网站访问 ERNIE 4.5 和 ERNIE X1。
对于企业用户和开发者,ERNIE 4.5 现已通过百度智能云千帆平台提供 API 访问。ERNIE X1 预计将很快开放。
API 访问定价:
ERNIE 4.5: 输入:0.55 美元/百万 tokens 输出:2.2 美元/百万 tokens
ERNIE X1: 输入:0.28 美元/百万 tokens 输出:1.1 美元/百万 tokens
相比之下:
GPT-4.5 通过 OpenAI API 的价格惊人地高: 输入:75.00 美元/百万 tokens 输出:150.00 美元/百万 tokens
DeepSeek R1: 输入:0.55 美元/百万 tokens 输出:2.19 美元/百万 tokens
百度还宣布计划将 ERNIE 4.5 和 ERNIE X1 集成到其更广泛的生态系统中,包括百度搜索和文小言应用。
企业决策者考虑要点 对于 CIO、CTO、IT 领导者和 DevOps 团队,ERNIE 4.5 和 ERNIE X1 的发布带来了机遇和需要考虑的因素:
性能与成本 - 由于价格显著低于竞争模型,通过 API 集成 ERNIE 模型的组织可能会节省成本。然而,可能需要进一步的基准测试和实际应用测试来评估特定业务应用的性能。
多模态和推理能力 - 处理和理解文本、图像、音频和视频的能力对客户支持、内容生成、法律科技和金融等行业的企业可能具有价值。
工具集成 - ERNIE X1 能够与高级搜索、基于文档的问答和代码解释等工具配合使用,可能为企业环境提供自动化和效率提升。
生态系统和本地化 - 由于百度的 AI 模型针对中文处理和区域知识进行了优化,在中国开展业务或针对中文市场的企业可能会发现 ERNIE 模型比全球替代方案更有效。
许可和数据隐私 - 虽然百度表示将于 2025 年 6 月 30 日开源 GPT-4.5,但这还需要三个月的时间,因此企业应至少等到那时再评估是否值得在本地或美国托管的云服务上部署。企业用户在集成这些 AI 解决方案之前,应审查百度关于数据隐私、合规性和模型使用的政策。
AI 扩展和未来展望 随着 2025 年 AI 发展加速,百度正在将自己定位为多模态和基于推理的 AI 技术的领导者。
该公司计划继续投资人工智能、数据中心和云基础设施,以增强其基础模型的能力。
通过提供强大性能和较低成本的组合,百度最新的 AI 模型旨在为企业和个人用户提供更易获取和更先进的 AI 工具。
更多详情,请访问文心一言官方网站。
来源:至顶网