摘要:11月13日,「百度世界2025」大会在北京召开,已经让人期待了几乎一整年的百度最新基座大模型——文心5.0终于亮相,参数量高达2.4万亿,号称原生多模态融合,这些技术指标可谓都走到了世界前列。
今天,百度真的放大招了。
11月13日,「百度世界2025」大会在北京召开,已经让人期待了几乎一整年的百度最新基座大模型——文心5.0终于亮相,参数量高达2.4万亿,号称原生多模态融合,这些技术指标可谓都走到了世界前列。
从评分来看,文心5.0也不负所望。早在上周,名为ernie-5.0-preview-1022的预览版本已经登上了LMArena排行榜,截至目前排在全球第8的位置,超越了deepseek-r1-0528,在国产模型中仅次于阿里Qwen3-max-preview和智谱GLM-4.6。其创意写作能力更是排行全球并列第一。
针对复杂的产业场景,百度还发布了全球首个自我演化智能体“伐谋”,其在最近三个相关的全球公开测试上都表现惊艳,甚至实现了全榜单的SOTA。
硬件层面,百度基于昆仑芯的超节点产品天池升级到256与512版本,据称单个天池512超节点就能完成万亿参数模型训练。昆仑芯的新一代芯片M100则预计2026年上市,同时预告了2028年上市的M300,后者据称可用于训练环节。
今年下半年以来,无论是通义千问、百度文心,还是Kimi、智谱,在基座模型上的你追我赶之势,都显示出全球大模型竞争还处在相当开放的状态。
属于百度的SOTA时刻
今天上午,李彦宏在百度世界大会上正式发布了新一代文心5.0大模型。据介绍,文心5.0基础能力全面升级,在多模态理解、指令遵循、创意写作、事实性、智能体规划与工具应用等方面表现突出,拥有强大的理解、逻辑、记忆和说服力。
尤其是在多模态领域,不同于此前主流的后期融合方式,文心5.0号称采用了统一的自回归架构进行原生全模态建模,理解与生成一体化,从训练开始便融合语言、图像、视频、音频等多模态数据。
MoE架构上,文心5.0采用了超稀疏混合专家架构,进行庞大的全模态训练,总参数规模超过2.4万亿,激活参数比例低于3%,在保持模型强大能力的同时有效提升推理效率。
此外,百度还拿下了另一项意义重大的SOTA。
上个月,一篇百度副总裁沈抖等人署名的论文悄然出现在预印本平台arxiv上,该论文提出了一个名为FM Agent的通用多智能体框架,登顶OpenAI机器学习工程权威基准MLE-Bench,拿下SOTA成绩,超越微软R&D Agent和OpenAI展示的AIDE系统。
据介绍,该框架创新性地结合了大型语言模型(LLM)的推理能力和大规模进化搜索,以自动化方式在运筹优化、机器学习、GPU内核优化和数学问题等多个领域解决复杂的现实世界挑战,可运用于交通管理、金融风控、农田灌溉、生产线调度等诸多实际场景。
在今天的百度世界大会上,FM的真身「伐谋」也正式亮相。李彦宏指出,伐谋是一款「自我演化」的智能体,最主要的应用场景就是找「全局最优」。正如其名字的来源「上兵伐谋」,伐谋智能体并非依赖算力来暴力计算解决方案,而是试图实现战略级的规划和推演。
具体来说,伐谋可谓一个「产业大脑」,可运用于交通、能源、金融、物流等领域,作用就是在这些高度复杂的场景中,让AI自我学习,找到人类难以计算的最优解。
大会现场展示的一个典型的应用场景,是海上风电平台设计。在普通人看来,海上风电设施或许就像是海面上长出的一片平静森林,表面上井然有序,但实际上,海上风电项目需协调风机、海缆、升压站等设施的布局,如何在有限的平台空间上最高效地规划出错综复杂的能源管道,是一个全球公认的难题。
中国能源建设集团广东院数字工程研究院与百度合作,将伐谋应用到海上风电设计、电缆桥架布置中。相比于传统的人工设计,伐谋的加入既能快速产出高质量的优化方案,又能对动态调整的约束和目标有极强的适应能力,而且这套能力还可以快速迁移到不同类型的管道布置场景中。这不仅节省了大量成本和近一周的工期,更重要的是,它把工程师从繁重的体力劳动中解放出来,让他们能专注于更宏观的创造性问题。
另一个场景是交通信号灯的控制。鄂尔多斯伊金霍洛旗,新老城区跨河通勤需求旺盛,早晚高峰拥堵频发,引入百度智能云SaaS信控平台后,用AI调控红绿灯配时方案,车均延误降低13%,百度智能云SaaS信控平台在百度FM的赋能下,实现算法自主迭代,找到城市缓堵治理的最优解,车均延误再降低50%。
中国拥有41个工业大类、207个工业中类、666个工业小类,是全世界唯一拥有联合国产业分类中全部工业门类的国家,有最完整的产业链。伐谋就是为这些专业应用场景所准备,能够拿下全球最佳成绩,可谓是合情合理。
垂类场景持续渗透
除了全新智能体伐谋之外,百度数字人和智能体产品的全场景覆盖优势也继续强化。
百度世界大会上,李彦宏宣布,慧播星数字人技术向全行业开放。目前,慧播星数字人已率先落地巴西市场,与Kwai平台深度合作,后续计划出海到东南亚及美国等国家,并积极拓展至Shopee、Lazada等主流平台。
本次双11,慧播星数字人GMV同比提升91%,开播直播间数同比增长了119%,83%的开播主播使用过数字人。
百度还发布新一代数字人「实时互动型数字人」,现场展示其「多模一体实时生成」的核心技术。「实时互动型数字人」可实现实时响应、声情并茂、明察善断。未来,实时互动型数字人将在法律咨询、情感咨询、教育规划等需要高信任、高并发的服务场景中发挥更大价值,成为人与服务之间的高效连接。
智能体方面,百度独树一帜的无代码编程智能体「秒哒」升级到2.0版本,并首次推出海外版MeDo,荣登全球产品榜Product Hunt榜首。
文库网盘GenFlow也来到了3.0版本,截至目前,GenFlow3.0已拥有20002万的用户量,成为全球最大的通用Agent。基于百度文库的全新能力,百度文库还在海外推出了一站式AI学习办公平台Oreate,在短时间内达到120万海外用户规模。
在看家本领搜索引擎方面,百度也是全球AI化改造最激进的,不仅由AI生成文字结果,还加入了大量视频、图片等富媒体内容。李彦宏指出,百度搜索绝大部分的搜索结果由AI生成,而首条结果的富媒体覆盖率已达70%。“你现在搜索10个问题,7个答案都是富媒体的,不是一条条的文字链接,而是一个图片、一个视频、一个直播,甚至是一个数字人!”
百度也继续成为全球实际运营规模最大的Robotaxi服务商。截至10月31日,萝卜快跑每周订单量超25万单,且100%为全无人订单。从累计服务单量来看,萝卜快跑全球订单超过1700万单。萝卜快跑自动驾驶总里程已超过2.4亿公里,其中全无人驾驶里程已突破1.4亿公里。
昆仑芯前景令人期待
作为国内最早把战略重心向AI转移的互联网企业之一,百度一向以“全栈”布局见长。在硬件层面上,百度也继续拿出了新的成绩。
在百度世界大会上,百度正式发布新一代昆仑芯和超节点产品天池。
全新一代昆仑芯包括两款产品。其中,昆仑芯M100 针对大规模推理场景优化设计,提供极致性价比,将于2026年上市;昆仑芯M300面向超大规模多模态模型的训练和推理需求提供极致性能,将于2027年上市。
同步发布的天池256超节点与天池512超节点将于明年正式上市,单个天池512超节点就能完成万亿参数模型训练。
同时,百度还预告了未来五年的宏大计划,据称2030年将推出百万卡昆仑芯单集群。
目前,昆仑芯已累计完成数万卡部署,成为了百度AI关键底座。百度智能云也通过昆仑芯和百舸AI计算平台,为大批企业提供了高性能、可扩展的AI算力。凭借全栈AI云能力布局,百度智能云已连续六年位列中国AI云服务市场份额第一。
来源:新浪财经
