火山引擎发布豆包大模型1.6,全线迈入全球第一梯队

B站影视 内地电影 2025-06-11 21:28 1

摘要:6月11日,字节跳动旗下火山引擎举办Force原动力大会,发布豆包大模型1.6、视频生成模型Seedance 1.0 pro等新模型,并升级了Agent开发平台等AI云原生服务。

6月11日,字节跳动旗下火山引擎举办Force原动力大会,发布豆包大模型1.6、视频生成模型Seedance 1.0 pro等新模型,并升级了Agent开发平台等AI云原生服务。

字节跳动 CEO 梁汝波表示,做好火山引擎对字节跳动成为一家优秀的科技公司、保持技术竞争力很重要。未来,字节跳动会坚定长期投入,追求智能突破,服务产业应用。

全新发布的豆包大模型1.6系列由三个模型组成,为企业提供多样化选择。

· doubao-seed-1.6:All-in-One 的综合模型,是国内首个支持256K 上下文的思考模型,支持深度思考、多模态理解、图形界面操作等多项能力。支持选择开启或关闭深度思考、自适应思考三种方式,其中自适应思考模式可根据提示词难度自动决定是否开启思考,提升效果的同时大幅减少 tokens 消耗。

· doubao-seed-1.6-thinking:豆包大模型1.6系列在深度思考方面的强化版本;在代码、数学、逻辑推理等基础能力上进一步提升;支持256K 上下文。

· doubao-seed-1.6-flash:豆包大模型1.6系列的极速版本,支持深度思考、多模态理解、256K 上下文;延迟极低,TOPT 仅需10ms;视觉理解能力比肩友商旗舰模型。

豆包1.6模型披露多项权威测评成绩。在复杂推理、竞赛级数学、多轮对话和指令遵循等测试集上,豆包1.6-thinking的表现已跻身全球前列。

据火山引擎总裁谭待介绍,豆包1.6系列模型支持多模态理解和图形界面操作,能够理解和处理真实世界问题。此前,豆包1.5的多模态能力在60个公开评测基准中取得38项最佳成绩,已广泛应用在电商识图、自动驾驶数据标注、门店巡检等场景。图形界面操作能力则让豆包1.6进一步具备“行动力”。演示案例显示,豆包1.6可自动操作浏览器完成酒店预定,识别购物小票并整理成Excel表格等任务。

全新发布的豆包·视频生成模型 Seedance 1.0 pro 具备三大特性:无缝多镜头叙事、多动作及随心运镜、稳定运动与真实美感,在电商、影视、游戏等行业应用前景广阔。

根据第三方权威榜单 Artificial Analysis 最新结果,Seedance 1.0 pro 在文生视频、图生视频两个维度都超越了业界诸多主流模型,登顶全球竞技场第一。

语音正在成为 AI 应用和 Agent 的核心交互方式,小米汽车、OPPO、美图、儿歌多多等企业已使用豆包语音大模型提升产品创新体验。

今天,豆包·实时语音模型全量上线火山方舟,对企业客户开放使用。该模型支持自然语言高级指令控制,具备唱歌表演、声线模仿、方言演绎等多种能力,语气、用语、思考方式等拟人感大幅提升,能随时打断与主动搭话。

此外,火山引擎还发布了豆包·语音播客模型。只需输入一句话、网页链接、长文本或文档,语音播客模型即可快速搜索学习,生成播客脚本后创作出来;模型可秒级生成双人对话式播客作品,效果自然,具有互相附和、插话、犹豫等播客节奏;自带的深度搜索功能可生成跟进热点话题的播客内容。

来源:智慧科技生活一点号

相关推荐