豆包大模型升级1.6版,视频模型上新

B站影视 内地电影 2025-06-11 18:37 1

摘要:在今天召开的火山引擎Force原动力大会上,豆包大模型升级为1.6版,推理、数学、指令遵循、Agent等能力有较大提升;豆包·视频生成模型Seedance 1.0 pro、豆包·语音播客模型也正式发布。

*本音频由豆包·语音播客模型生成,该功能已在豆包电脑版开启小流量测试,并上线子空间

在今天召开的火山引擎Force原动力大会上,豆包大模型升级为1.6版,推理、数学、指令遵循、Agent等能力有较大提升;豆包·视频生成模型Seedance 1.0 pro、豆包·语音播客模型也正式发布。

01. 豆包大模型1.6

豆包1.6-thinking模型在多个权威测评集上达到全球第一梯队水平:GPQA Diamond测试成绩达到81.5分,是目前最好的推理模型之一;数学测评AIME25成绩达到86.3分,相比豆包1.5深度思考模型大幅提升12.3分。

豆包大模型1.6系列均支持深度思考、多模态理解、256k长上下文、图形界面操作等能力,能够更好地支持复杂Agent的构建,促进AI生产力的提升。

目前,豆包大模型1.6系列已在火山引擎上线,企业和开发者可调用API体验。

02.

豆包·视频生成模型Seedance 1.0 pro

Seedance 1.0 pro支持文字与图片输入,可生成多镜头无缝切换的1080p高品质视频,主体运动稳定性与画面自然度较高。在国际知名评测榜单Artificial Analysis上,Seedance 1.0 pro在文生视频、图生视频两个任务的表现均排名首位。

通过调研影视创作者等群体的实际需求,Seedance 1.0 pro不仅将指令遵循、运动稳定性、画面质量等行业共识性指标纳入攻坚方向,同时,也将多任务生成、1080p高清生成、快速视频生成等难题作为核心目标。新版模型在动态图像生成的各维度上,有较好的综合表现,尤其动作生成、指令遵循等关键能力处于业界前列,推理速度、用户好评度等方面也比较突出。

提示词:赛车比赛,紧张激烈地运动,速度激烈,多镜头切换

提示词:广角镜头,金黄色草原随风起伏,一匹白马静立。中景,女孩缓缓走近,风吹起裙摆。她抬手触碰白马,光线柔和逆光

目前,Seedance 1.0 pro已通过火山引擎、豆包App、即梦AI等平台对外开放。

Artificial Analysis 文生视频榜单,数据截至 2025-06-09 11:00 (GMT+8)

Artificial Analysis 图生视频榜单,数据截至 2025-06-09 11:00 (GMT+8)

(注:为实现评估上的统一,Artificial Analysis 将 Veo 3 Preview 生成视频去掉声音后参与上述榜单评测。)

关于Seedance 1.0 pro的更多技术细节,详见项目主页(可查看完整技术报告):https://seed.bytedance.com/seedance

03. 豆包·语音播客模型

语音正在成为生成式AI应用和Agent的重要交互方式。自从豆包实时语音模型上线后,实时语音、视频通话迅速成为深受豆包用户喜爱的功能。

全新发布的豆包·语音播客模型源于端到端实时语音的进一步拓展,能够实现从文本创作到双人对话式播客作品的秒级生成,同时具备互相附和、插话、犹豫等自然的播客元素生成,达到了媲美真人的生成效果。

用户可以在扣子空间(https://space.coze.cn/)体验语音播客相关功能。同时,豆包产品已启动小流量测试,近期将全量上线播客模型,敬请关注。

来源:字节跳动技术团队

相关推荐