【深度】“后进生”切大模型蛋糕:字节“赛马”机制或面临资金挑战

B站影视 2025-01-24 12:24 3

摘要:“入局晚,发力强”,这是行业对于字节跳动(以下简称“字节”)AI(人工智能)的整体印象,但在此之下,字节也大都是以产品为核心,结合自身生态发力,现在字节又释放出了一个新目标——追寻AGI。

“入局晚,发力强”,这是行业对于字节跳动(以下简称“字节”)AI(人工智能)的整体印象,但在此之下,字节也大都是以产品为核心,结合自身生态发力,现在字节又释放出了一个新目标——追寻AGI。

据晚点latepost报道,字节旗下豆包大模型团队日前正式设立了一个代号为“Seed Edge”的研究项目,鼓励项目成员探索更长周期、不确定的和大胆的AGI研究课题。

接近字节的知情人士透露,Seed Edge的目标是探索AGI的新方法,代号名中“Seed”即豆包大模型团队名称,“Edge”代表最前沿的AGI探索。Seed Edge鼓励跨模态、跨团队合作,为项目成员提供宽松的研究环境,实行采用更长周期的考核方式,以保障挑战真正颠覆性的AGI课题。同时,Seed Edge也将得到单独的算力资源保障。

报道称,该项目已初步确定了五大研究方向,包括探索推理能力的边界、探索感知能力的边界、探索软硬一体的下一代模型设计、探索下一代AI学习范式、探索下一个scaling(规模)方向。

与此同时,一个消息开始在社交媒体流传:字节2025年在人工智能基础设施上投入超120亿美元,其中为2025年购买AI芯片准备了400亿元人民币,是2024年支出的两倍。另计划在海外投资约68亿美元。此外,还有消息称,公司计划2025年斥资至多70亿美元购买英伟达芯片。

模型价格业界最低,还有高毛利

对此,字节跳动相关人士回应称:相关消息并不准确。字节跳动非常重视人工智能领域的发展与投入,但相关预算与规划传闻并不正确。

字节虽然否认,但行业还是对此感到压力,作为AI的“后进生”,字节正在发挥自己“大力出奇迹”的长处,向大模型砸钱、砸资源。仅2024年,字节在AI领域投入就达到800亿元。

据了解,字节跳动创始人张一鸣虽然在2021年卸任CEO,但仍然深度参与集团的AI战略布局。多位公司内部人士透露,张一鸣不仅亲自负责从竞争对手公司招揽中国AI人才,还多次在内部强调追求“通用人工智能”的目标。

在产品端,字节近日也是强势出击。1 月 22 日,字节迭代豆包基础模型刚过一个月,又发布融合多模态能力的豆包 1.5 Pro 模型,称 “用较小激活参数,即可比肩一流超大稠密预训练模型的性能”。

豆包 1.5 Pro 是一个 MoE(混合专家系统)模型,此类模型解决问题时不用激活模型所有参数,能提升计算效率、降低成本。MoE 模型的性能通常用能力相同的稠密模型(解决问题时激活所有参数)的总参数量和 MoE 模型的激活参数量的比值来确定,这被称为 “性能杠杆”,业界此前的普遍水平为不到 3 倍。

字节称,用完全相同的部分训练数据(9T tokens)对比验证,他们优化后的 MoE 架构,仅需激活性能相当的稠密模型 1/7 的参数量,就能有更好表现,性能杠杆提升至 7 倍。

数据显示,截至2024年12月中旬,豆包通用模型的日均tokens使用量已超过4万亿。1月份的数据应该会更高,“1.5pro可以说是让豆包稳稳站进了国内大模型第一梯队。”一位行业人士如是说。

二级市场率先嗅到这一变化,2024年12月之后,A股市场人工智能(AI)题材的热度持续升温,尤其是豆包概念股,在Kimi概念股、智谱概念股之后,成为了市场上的新宠。

近三日,豆包概念股开启强势上涨,其中包括深度参与字节硬件合作,为相关智能硬件设备接入豆包大模型提供支持的乐鑫科技(688018.SH),为豆包AI玩具提供芯片模组的移远通信(603236.SH),为豆包大模型提供强大数据存储和运算支持的字节跳动数据中心供应商润泽科技(300442.SZ)等等。

1月23日,抖音豆包概念股震荡走强,汉得信息20CM涨停,久其软件涨停,彩讯股份、佳云科技、天龙集团、值得买、易点天下等跟涨。

《财中社》发现,字节AI战略当下有两个特点,一方面字节不断升级模型能力,不断积累人才,追寻AGI,张一鸣本人也参与其中,无论是行业影响力,还是用户心智,都在向国内顶级AI公司迈进,一改此前“利用ChatGPT生成数据进行预训练”的负面口碑;另一方面,在用户规模、产品生态等优势加持下,字节可以不断压低模型价格,依旧可以保持高利润率。

界面报道称,豆包大模型2024年大幅降价后,毛利率依然为正。其中,字节最新推出的豆包大模型1.5,在推理成本优化上取得进一步突破。在火山引擎上售卖API的Doubao-1.5-pro,毛利率仍能达到50%。

字节认为原因主要有两个:

一方面,豆包大模型的调用量在快速增长。字节对外公布的数据显示,截至2024年12月中旬,豆包通用模型的日均tokens使用量已超过4万亿,较首次发布时增长了33倍。

另一方面,豆包大模型的能力快速提升,但成本仍在持续降低。1月22日,字节发布了豆包大模型1.5Pro,性能比之前版本显著增强,多项基准测试甚至超过GPT4o,推理成本却大幅降低。

据火山引擎官网,Doubao-1.5-pro-32k的百万tokens输入价格仍为0.8元,命中缓存为0.16元,输出价格为2元;轻量化版本Doubao-1.5-lite-32k的百万tokens输入价格0.3元,命中缓存0.06元,输出价格0.6元。两款模型价格在业界同级别最低。

目前,字节系AI产品全线已经全面铺开,几乎包含了当下AI行业所有赛道。据字节介绍,豆包大模型是一个具备多模态能力的“模型家族”,包括通用模型 pro/lite、角色扮演模型、语音识别模型、文生图模型等 11 款 模型,2023 年 8 月通过备案并上线,2024 年 5 月正式发布。豆包已被应用于字节跳动旗下的 多个业务中,包括抖音、巨量引擎、飞书等 50 多个业务。在 C 端产 品方面,基于自研的豆包大模型,推出多款垂类应用,包括豆包、 星绘、即梦、猫箱、扣子等,覆盖内容、社交、创作等多个场景。

多轮“赛马”,“APP工厂”归来

在此“大力出奇迹”的动作之下,许多AI行业人士感觉到,移动互联网时期的那个“APP工厂”回来了。而App工厂名不虚传的背后,是字节的赛马机制。

据硅星人报道,去年开始字节内部就形成了多轮“赛马”制:

第一阶段,创新产品中心负责前期孵化、产品创意、内部审核以及完成产品的前期打造,到产品测试上线。在这个阶段几乎不会有流量支持,靠产品自身的形态吸引自然用户;

进入第二阶段的产品,开始可以拿到一部分初始预算进行外部推广,由专门负责增长的团队负责拉新留存,进行产品排名,数据表现好结合内部分析,从创新产品中心进入到具体的产品组;

而第三阶段,成型的产品开始进行大规模推广,如「猫箱」、「星绘」从2024年年底开始在抖音投流以及通过KOL推广。

字节AI产品今天的突飞猛进,是其赛马机制下,一套屡试不爽的产品开发方法论加持的结果。但与移动互联网时代字节的“生产体系”很不同的是,今天在底层的模型侧,字节也在进行着赛马。

字节可能寄希望于它也像应用一样,百花齐放后筛选出最强的那一个,但是大模型时代,“烧钱”已经是常态,尤其在模型能力增长方面,即使是“不差钱”的字节,面对OpenAI、xAI等动辄数十亿美元的融资,也将面临挑战。

来源:财中社

相关推荐