摘要:12月18日火山引擎 Force 大会上,字节跳动正式发布豆包视觉理解模型、豆包3D生成模型,以及全面更新的豆包通用模型pro、音乐模型、文生图模型等,为企业提供多模态大模型能力。
(图片来源:钛媒体AGI编辑林志佳拍摄)
字节跳动的豆包大模型及相关产品超出预期的表现持续引发行业关注。
钛媒体AGI获悉,12月18日火山引擎 Force 大会上,字节跳动正式发布豆包视觉理解模型、豆包3D生成模型,以及全面更新的豆包通用模型pro、音乐模型、文生图模型等,为企业提供多模态大模型能力。
值得一提的是,火山引擎总裁谭待宣布,豆包视觉理解模型输入价格仅为0.003元/千tokens,1块钱可处理284张720P的图片,比行业价格便宜85%。
会后,谭待对钛媒体AGI表示,当前字节并不关注市场竞争,因为大模型市场仍处于早期阶段,更多需要的是场景、需求是否被满足。长期来看,大模型C端和B端、虚拟和现实世界场景都应该是齐头并进发展,而非“半头热”。
“我觉得局部会有一些竞争,但这不是关键,最关键是你能不能把这些东西做好,能把成本做低,能不能把方案、落地应用做好,这样企业和用户能够用起来。我们年初发布大模型,但是你很少听到业界有谁用起来、用得很好,而5月份豆包发了之后,我们首先把成本做了很大降低,效果也做了很大提升,其实这半年大家才能看到更多市场上反馈模型的声音,在To b的领域,大家都是有竞争,也有合作的,我觉得很正常,主要还是大模型价值非常大,空间也非常大,然后还在增长。”谭待强调,火山引擎就朝着做中国大模型领域、新的技术变革第一名进行发展。
事实上,在与美国OpenAI的竞争中,从模型层,到软硬件协同推进,字节跳动已站稳AI大模型头部地位。今年11月的全球月活跃排行榜上,豆包App的MAU(月活跃用户数)接近6000万,仅次于OpenAI的ChatGPT,位列全球第二;截至目前,豆包大模型日均tokens使用量超过4万亿,发布7个月以来增长超过33倍。
同时,字节跳动旗下创作工具剪映和CapCut,全球月活用户也已超过8亿,并且在2024年实现收入增长超100%,总收入接近100亿元。张楠表示,即梦愿景是“想象力世界的相机”。
另外,字节跳动在 AI 人才投入、算力投入、基于扣子的Agent智能体、MaaS等 AI 软硬件领域的服务都进行全方位布局。
火山引擎总裁 谭待
那么,随着OpenAI大模型更迭放缓,Scaling Law和预训练出现“停滞”现象,字节跳动能否推动火山引擎成为全球AI领域的新“领头羊”?
豆包“全家桶”年末更新,视觉理解模型价格便宜85%2024年圣诞节之前,豆包大模型和相关服务终于迎来今年最后一次的重磅更新,下面钛媒体AGI梳理:模型家族、场景示例和价格优势、豆包大模型应用、火山方舟大模型平台四个部分进行介绍。
1、模型家族:豆包视觉理解模型、豆包3D生成模型,以及全面更新的豆包通用模型pro、音乐模型等。
今天公布的豆包视觉理解模型,目前已经接入豆包App和PC端产品,支持教育、电商营销等多个场景,提供极具性价比的多模态大模型能力。豆包视觉理解模型千tokens输入价格仅为3厘,一元钱就可处理284张720P的图片,比行业价格便宜85%。
豆包3D生成模型,是与火山引擎数字孪生平台veOmniverse结合使用,可以高效完成智能训练、数据合成和数字资产制作,成为一套支持 AIGC 创作的物理世界仿真模拟器。
此外,豆包通用模型pro也全面升级,对齐GPT-4o,使用价格仅为后者的1/8;音乐模型从生成60秒的简单结构,升级到生成3分钟的完整作品;文生图模型2.1版本,更是在业界首次实现精准生成汉字和一句话P图的产品化能力,该模型已接入即梦AI和豆包App。
此外,钛媒体AGI了解到,字节豆包新一代视频生成大模型将明年1月正式提供服务。此外,抖音旗下图片和视频生成工具——即梦AI,也新增新一代图片生成模型和动态海报功能。
2、场景示例和价格优势
字节跳动和旗下火山引擎正在加速大模型场景落地。据悉,豆包大模型已经与赛力斯、东风等80%主流汽车品牌合作,并接入到多家手机、PC等智能终端,覆盖终端设备约3亿台,来自智能终端的豆包大模型调用量在半年时间内增长100倍。
与企业生产力相关的场景,最近3个月,豆包大模型在信息处理场景的调用量增长了39倍,客服与销售场景增长16倍,硬件终端场景增长13倍,AI工具场景增长9倍,学习教育等场景也有大幅增长。
谭待认为,豆包大模型市场份额的爆发,得益于火山引擎“更强模型、更低成本、更易落地”的发展理念,让AI成为每一家企业都能用得起、用得好的普惠科技。
3、Agent和豆包大模型应用
此次活动上,豆包 AI Agent智能体应用成为关注焦点。
火山引擎升级了火山方舟、扣子和 HiAgent 三款平台产品,帮助企业构建好AI能力中心,高效开发AI应用。
谭待发布了扣子1.5版本,支持 GUI 搭建界面,并一键发布为小程序、H5、API 等多种应用形态。目前,扣子1.5版本已有超过100万活跃开发者,发布超过200万个智能体。
4、火山方舟大模型平台
会上,火山方舟首次发布大模型记忆方案,并推出 prefix cache 和 session cache API,降低延迟和成本,同时火山方舟还新增全域 AI 搜索,具备场景化搜索推荐一体化、企业私域信息整合等服务。
基于AI云原生的理念,火山引擎推出了新一代计算、网络、存储、安全产品。其中,存储上,新推出EIC弹性极速缓存能实现GPU直连,使大模型推理时延降低至1/50、成本降低20%。
目前,火山引擎拥有底层基础设施和技术架构,中层豆包大模型家族,上层火山方舟、扣子、HiAgent等构建的 AI 应用开发平台,从而形成字节在 AI 领域的全方位布局和商业落地。
谭待认为,下一个十年,计算范式应该从云原生进入到AI云原生的新时代。
AI产业进入“深水区”,火山引擎是否已迎来“OpenAI时刻”?当前,全球生成式 AI 赛道已经进入了“深水区”,竞争激烈,而持续领先的OpenAI如今却开始“掉队”。
奥尔特曼(Sam Altman)宣布的12月5日开始为期12天的“OpenAI 12日”活动,已进展到第9天,但其新产品的热度和吸引力,却都被谷歌的大模型Gemini2.0、量子计算芯片Willow、视频模型VEO 2等所取代。
这意味着,ChatGPT发布两年之后,谷歌迎来了他的“OpenAI时刻”,技术创新差距越拉越小,且谷歌AI视频模型VEO 2效果隐隐超越Sora。
公开数据显示,谷歌预计2024年每个季度的资本支出都在120亿美金以上,全年同比增长49%以上,主要用于AI基础设施方面;微软也持续扩大AI投资规模,季度资本支出超过140亿美元;而Meta今年全年资本开支从300亿-370亿美元上调到350亿-400亿美元,以建设数据中心来支持AI业务。
因此,随着Scaling Law出现放缓,同时谷歌、微软、Meta等大科技公司加大对 AI 领域的资源投入力度,AI 大模型进入了应用和商业落地阶段,OpenAI巨大的产品先发优势正慢慢消退,大模型与OpenAI变得没有特别大的差距了。
回到国内,自2023年起,作为国内云与智能提供商,字节跳动的火山引擎持续加大在AI人才、AI算力、To B商业化、AI智能体应用等多层面、全方位布局。基于豆包大模型更强模型、更易落地、更低价格特点,如今已提供火山方舟大模型服务平台和解决方案,助力客户提速增效。
2023年11月,字节跳动成立Flow部门,Flow团队成立后,字节跳动在大模型领域的架构基本确立,即Seed团队主攻大模型研发领域;Flow团队聚焦于AI 产品应用开发工作;Stone团队承担技术支持职能。
同时,过去一年,豆包还在国外同步推进 AI 应用布局,持续在全球推出十多款基于AI 和大模型技术的产品,构建“超级AI应用工厂”,实现国内外 AI 模型与应用的“双向复制”。
如今在B端商业化层面,基于豆包大模型的技术能力,火山引擎已经宣布与30+行业外部企业深度共创豆包大模型商业落地,在零售、游戏、汽车、教育、医疗、企业服务等领域助力客户提速增效。
C端层面,豆包App日活900万、月活6000万,已经成为中国消费者首选的 AI 应用。尽管基于大模型训练此类应用的成本很高,但字节跳动尚未宣布任何将豆包在C端商业化的计划。
谭待对钛媒体AGI表示,当前端侧 AI 商业化还未完全成熟。“端模型现在主要靠芯片,芯片现在还不成熟,所以现在讨论这事是为时太早。”
谈及Agent发展,谭待认为,“从B端角度看,当前Agent做的其实是不够的,因为AGI的价值在于他能替代、辅助人多长时间的工作,如果他辅助人是一分钟的工作,比如说帮你写首打油诗,这个就价值不大。当然智能客服价值是比较大的,而我觉得今年其实还没有那么高的Agent,明年会有一些突破。”
“我觉得最核心还是技术要好。应该说什么时候切入,这都是表象,你东西不行,怎么切都切不进去。因为这个账很好算,你用人家做的东西,跟我原来用人或用原来系统做的一比较,效果能不能更好,而且成本还能否更低,你就把这个做到了,你怎么切都切得进去。”谭待随后补充称,未来十年,AI云原生将是很大的机遇,今天还是初期阶段,未来基础架构会发生变化,从互联网到 AI 进行眼神,“我想火山应该做成这一领域的领军企业。”
谭待曾指出,作为国内第一个把模型成本做到每千token低于一厘钱的企业,火山引擎的豆包大模型推动大量的创新应用随之不断涌现,模型调用量突飞猛进,大家共同努力让应用的生态更加繁荣。
据研究机构IDC预测,到2030年,AI将为全球经济贡献19.9万亿美元,推动2030年全球GDP增长3.5%。这意味着,AI是全球经济增长的新引擎。
在演讲结尾,谭待强调,“今年是大模型高速发展的一年。当你看到一列高速行驶的列车,最重要的事就是确保自己要登上这趟列车。通过AI云原生和豆包大模型家族,火山引擎希望帮助企业做好AI创新,驶向更美好的未来。”
来源:钛媒体APP一点号