文心X1 Turbo获信通院“4+级”最高评级,百度副总裁吴甜详解底层技术

B站影视 日本电影 2025-05-20 19:08 1

摘要:她介绍,文心大模型4.5是多模态基础大模型,文心4.5 Turbo源自文心4.5,效果更好、成本更低;基于文心4.5 Turbo,文心X1升级到X1 Turbo,性能提升的同时,具备更先进的思维链,问答、创作、逻辑推理、工具调用和多模态能力进一步增强。

5月20日,百度AI Day上,中国信通院发布大模型推理能力评估结果,百度文心X1 Turbo成为国内首个获得“4+级”最高评级的大模型。

据介绍,该模型在24项能力评估中,16项达5分、7项达4分、1项达3分,覆盖逻辑推理、代码能力、工具使用及安全可靠性等关键指标。

活动现场,百度集团副总裁吴甜对文心大模型最新版本的技术创新进行了系统性的讲解。

百度集团副总裁吴甜

她介绍,文心大模型4.5是多模态基础大模型,文心4.5 Turbo源自文心4.5,效果更好、成本更低;基于文心4.5 Turbo,文心X1升级到X1 Turbo,性能提升的同时,具备更先进的思维链,问答、创作、逻辑推理、工具调用和多模态能力进一步增强。

文心4.5和4.5 Turbo实现了文本、图像和视频的混合训练。针对不同模态数据在结构、规模、知识密度上的差异,通过多模态异构专家建模、自适应分辨率视觉编码、时空重排列的三维旋转位置编码、自适应模态感知损失计算等技术,大幅提升跨模态学习效率和多模态融合效果,学习效率提高近2倍,多模态理解效果提升超过30%。

后训练方面,百度研制了自反馈增强的技术框架,基于大模型自身的生成和评估反馈能力,实现了“训练-生成-反馈-增强”的模型迭代闭环,让大模型拥有了自我迭代的“最强大脑”,不仅解决了大模型对齐过程中,数据生产难度大、成本高、速度慢等问题,而且显著降低了模型幻觉,模型理解和处理复杂任务的能力大幅提升。

在训练阶段,通过融合偏好学习的强化学习技术,实现多元统一奖励机制,提升了对结果质量判别的准确率。通过离线偏好学习和在线强化学习统一优化,进一步提升了数据利用效率和训练稳定性,并增强了模型对高质量结果的感知。此外,通过偏好信号与奖励信号的融合运用,模型的理解、生成、逻辑和记忆等能力全面提升。

深度思考方面,突破了仅基于思维链优化的范式,在思考路径中结合工具调用,构建了融合思考和行动的复合思维链,模型解决问题能力得到显著提升,模型输出结果思路清晰、逻辑严密,表达自然。同时,结合多元统一的奖励机制,实现了思考和行动链的端到端优化,大幅提升了跨领域的问题解决能力。

数据方面,打造了“数据挖掘与合成 - 数据分析与评估 - 模型能力反馈”的数据建设闭环,为模型训练源源不断地生产知识密度高、类型多样、领域覆盖广的大规模数据。同时,数据建设流程具备良好的可扩展性,能够轻松迁移到全新的数据类型,实现快速、高效的数据生产。

值得一提的是,X1 Turbo性能提升背后依托百度飞桨平台的框架和算力优化。吴甜表示,文心4.5 Turbo的训练吞吐量为前代的5.4倍,推理吞吐量提升至8倍。飞桨平台目前已汇聚2185万开发者,赋能67万家企业。

此外,吴甜还展示了新模型在实际场景的落地成果。据透露,超拟真数字人已支持超过10万主播,直播转化率达31%;文心快码则已服务760万开发者,生成代码占百度日新增代码的40%以上。(袁宁)

来源:视线科技圈

相关推荐