腾讯混元大模型战略加速:全球首个全模态模型将于年内发布

B站影视 欧美电影 2025-05-26 17:17 3

摘要:自研大模型混元将迎来重大升级,基于腾讯自研大模型混元的首个端到端语音通话模型Hunyuan-Voice,最快将于今年6月上线腾讯元宝App,与字节跳动旗下的豆包AI视频通话功能形成正面竞争。

5月26日,据钛媒体报道,腾讯(00700)自研大模型混元将迎来重大升级,基于腾讯自研大模型混元的首个端到端语音通话模型Hunyuan-Voice,最快将于今年6月上线腾讯元宝App,与字节跳动旗下的豆包AI视频通话功能形成正面竞争。

同时,腾讯已规划多模态和全模态路线,全球首个全模态模型(代号“混元-O”)将于年内发布。该模型以语言为核心,融合视觉、语音、3D等多模态能力,目标是构建可更好理解物理世界并自主行动的“世界模型”。

有腾讯TEG(技术工程)事业群的腾讯混元科研人员透露,面向AGI(通用人工智能),混元将以语言模型为核心,探索多模态融合,并将向深度、广度两方面持续推进探索。

该消息或与5月21日腾讯举行的“2025 腾讯云 AI产业应用峰会”上宣布的多个成果相关。

腾讯云在峰会上宣布其大模型知识引擎全面升级为腾讯云智能体开发平台(TCADP),并正式对外发布。

升级后的TCADP,接入DeepSeek-R1/V3模型和联网搜索,整合了腾讯云行业领先的RAG(检索增强生成)技术、全面的Agent(智能体)能力以及符合用户需求的功能,支持企业快速激活私域知识、构建专属Agent。

会上,腾讯计划在近日推出“世界模型”、混元3D场景模型,并开源全系模型、企业级混合推理模型、端侧混合推理模型,多模态基础模型将持续开源。

图片来源:腾讯公司公关总监张军微博

来源:财中社

相关推荐