摘要:海外大模型玩家竞争格局收敛,OpenAI领跑,与Anthropic、谷歌厂商形成第一梯队。2023年全球范围内OpenAI领先优势明 显,但进入2024年,GPT-5进度延缓,随着Anthropic Claude3.5/谷歌Gemini1.5的推出,第一梯队模
海外模型:竞争格局收敛,形成5家超级公司
海外大模型玩家竞争格局收敛,OpenAI领跑,与Anthropic、谷歌厂商形成第一梯队。2023年全球范围内OpenAI领先优势明 显,但进入2024年,GPT-5进度延缓,随着Anthropic Claude3.5/谷歌Gemini1.5的推出,第一梯队模型厂商能力差距缩小, Anthropic旗舰模型如代码能力等方面超越GPT-4o。一梯队中,OpenAI具有先发、品牌认知、商业化能力等优势;Anthropic人 才优势显著;而谷歌具备垂直整合能力更强,其TPU有望在2025年与英伟达GPU正面竞争;x AI算力和人才资源增长迅速,以 创纪录的速度打造了拥有10万GPU的“Colossus”集群,成为数据中心扩张的标杆,是潜在的一梯队预备成员。第二梯队Meta 采取差异化开源策略,Llama3.1有效缩小了开源模型和GPT-4差距。第三梯队Inflection、Adept、Character被巨头收购退出竞 争,其他玩家还包括Mietral AI、Cohere、ssi等。以巨头及巨头深度合作的厂商为主的海外大模型竞争格局已经形成。
国内模型:格局有望进一步集中,创业公司差异化布局
国内模型层目前主要由互联网大厂、创业公司和传统技术大厂三类组成,未来竞争格局有望进一步集中。2022年11月 ChatGPT发布后,国内模型厂商逐渐崛起,创业公司和互联网头部公司纷纷入局,目前我国AI大模型主流厂商大致可以分为三 类:1)互联网/科技大厂:以百度、阿里、腾讯、字节、华为等为代表,大模型驱动大厂云业务的增长,通常进行综合布局。 2)技术类公司:以昆仑万维、科大讯飞、商汤科技为代表的专注于AI研发与应用的科技公司,主要在已有业务和渠道上做延 伸;3)创业类公司:以智谱AI、MiniMax、阶跃星辰、百川智能、月之暗面和零一万物为代表的创业六小虎。创业类公司根 据自生的资源禀赋形成差异化的布局,如智谱更加聚焦B端和G端,Minmax在C端影响力较强,百川智能聚焦医疗赛道。
o1引领AI模型迭代新范式,推理侧Scaling Law成为新驱动
OpenAI 发布推理模型o1,引领AI模型迭代新范式。9月,OpenAI公布推理模型o1,o1推理模型重新分配计算资源,将更多 资源从训练侧转移到推理阶段,显著提升模型在复杂推理上的能力;同时o1采用强化学习加思维链(CoT)的模式,将原有 的人工思维链自动化,通过思维链把一个复杂问题拆解成若干简单步骤,这种链式推理过程帮助它在复杂任务中进行深度推 理,有利于大模型解决复杂逻辑问题,并生成精准的答案。o1模型通过自我对弈强化学习和过程奖励模型的结合,使模型在 推理能力和应用范围上实现了显著提升。12月,OpenAI正式发布o1满血版,相较o1-preview,o1数学性能提升近30%,代 码能力提升27%,o1 Pro Mode的数学性能在o1基础上提升7.5%,几天后OpenAI发布了下一代大模型o3,目前仍在进行安 全测试中,o3-mini版本将率先于25年1月底开放,在AIME 2024数学竞赛评测中,o3取得了96.7%的准确率,较o1提升 13.4%;在博士级科学问答基准GPQA Diamond上,o3准确率为87.7%,相较于上一代o1提升9.7%。
应用层百花齐放,2B和2C、软硬件各具亮点,关注可持续化商业模式的打造。整个AIGC产业链可以分成基础设施、模型层 以及应用层。模型层资源向头部玩家聚集,巨头24年加大资本开支投入算力,25年随着模型层格局的逐步清晰,行业进入到 价值实现和落地阶段,25年我们认为更多的投资机遇集中于应用端。目前应用端按类型分AI原生和X+AI两种,根据量子位 《中国AIGC应用全景报告》,前者占比接近57%。按产品形态分可分为软、硬件两种形态,目前国内90%+AI应用为软件形态, 而AI硬件开始层出不穷,尚未迎来“iPhone时刻”。商业模式上,C端AIGC应用达到50%,但商业模式仍在探索,B端产品 80%实现营收,商业模式更加清晰。按模态来分,目前44%的应用专注于文本生成,图像生成占比29%,音频占比15%,视 频占比9%,3D生成规模较小占比2%。
模型层能力向上成本向下推动应用创新。相比于移动互联网时代应用端的投入,大模型时代应用厂商既需要承担获客成本还需要承担 模型推理成本,厂商既需要关注PMF同时还需要考虑技术成本。今年以来,推理成本逐渐走低,我们认为明年这一趋势有望延续,降 低应用创新门槛。海外方面,以OpenAI为例,4月,GPT4升级到了GPT-4-Turbo,输入输出价格却分别下降67%/50%,5月13日发布 GPT-4o,模型性能升级,但输入输出价格较GPT-4-Turbo下降75%/67%。7月18日推出的小模型 GPT-4o mini输入输出价格分别为降 低至0.15和0.6 美金1M tokens。国内模型方面,今年国内AI模型厂商也陆续降价,以阿里为例,5月21日,阿里云宣布其9款商业化 及开源系列模型降价。其中,通义千问主力模型Qwen-Long的API输入价格降至0.0005元/千tokens,降幅达97%。9月19日阿里云在 云栖大会上宣布通义千问三款主力模型再降价。现阶段国内模型价格普遍只有OpenAI的20%-50%。成本下降,有望带动开发者调用 和探索,支撑应用侧的繁荣。
AI Agent:交互方式升级,Agent带动应用繁荣
AI Agent带动交互方式升级,进一步促进AI应用端繁荣。人类和AI交互按照自动化程度可以分为Embedding、Copilot和Agent模式,2024年AI Agent逐渐爆发,AI产品逐渐从Copilot模型向Agent模式转变,在大语言模型(LLM)驱动的Agent系统中,LLM充当Agent的大脑,并由 Planning(规划)、Memory(记忆)、Tools(工具)、Action(动作)等几个关键组件补充。
国内外厂商加大力度开发布局AI Agent,C端流量入口有望重塑,B端加速AI行业场景落地。国内外厂商加速布局AI Agent,根据彭博消息, OpenAI正在准备推出一款代号“Operator”的全新AI Agent产品,可以自动执行各种复杂操作,包括编写代码、预订旅行、自动电商购物等; Salesforce在9月12日推出自动化AI Agent产品——Agentforce,并在10月宣布Agentforce进入全面商用阶段,企业可构建定制AI Agent,连接 企业数据并代表员工执行销售、服务、营销、商务等相关任务。苹果于10月发布Apple Intelligence。国内厂商方面,荣耀率先发布首个跨应用 开放生态AI智能体,智谱于11月发布AutoGLM、AutoGLM-Web、AutoGLM-PC三款Agent产品。AI Agent改变AI交互方式,与AI端侧硬件相结合重 塑流量入口。在B端方面,则有望帮助AI加速落地行业场景。
软件:B端看好金融政务医疗等领域,C端期待杀手级产品
中美对比来看,美国市场AI应用当前更偏向于B端企业级服务,而在国内AI应用则更加侧重于从C端。 商业化方面,B端变现模式更加清晰且更快盈利, C端产品商业化潜力有待进一步开发,期待杀手级产品的出现。根据量子位 智库,B端产品从通用场景到垂直赛道分布较均,商业模式较为清晰且80%以上的产品均实现营收,B端用户需求明确,与C端 需求相比,指标更易量化。C端产品商业化潜力有待进一步开发,目前近50%的产品当前仍未有明确的收入模式,向公众免费 开放。这是由于C端用户需求并不明确,往往是供给激发需求对产品本身的体验要求较高,强调“易用性”。未来商业化潜力 有待进一步被开发。
B端应用:企业投入预算加大,看好金融政务医疗等方向
MaaS(Model as a Service)成为主流商业模式,MaaS指将AI模型及其相关能力打包成可重复使用的服务,使企业能够快 速高效地构建、部署、监控、调用模型,无须开发和维护底层基础能力。MaaS主要提供三部分能力:一、提供包括模型训练、 调优和部署在内的全栈平台型服务,二、大小模型及公私域数据集的丰富资产库服务;三、基于AI模型的应用开发工具服务。
AaaS(Agent as a Service)作为新兴服务模式,帮助大模型落地于多元应用场景中。AaaS是将AI Agent作为一种服务来 提供。AI Agent可以根据用户的需求和环境的变化,自主做出决策并执行相应的操作。通过AaaS平台,用户可以快速获取所 需的AI功能和服务,而无需担心Agent的开发、部署和维护等复杂问题,灵活应对不同应用场景、提高资源利用效率。同时, AaaS平台还支持对Agent进行动态调整和优化,以适应不断变化的需求和环境。AaaS模式使得大模型能够广泛应用于各种行 业场景中,推动其最终落地。
C端应用:商业化持续探索,期待杀手级产品落地
AI C端应用流量保持良好增长,ChatGPT周度活跃用户数突破3亿,web端流量较年初增长138%。2023年全球AI应用爆发, 2024年伴随AI在图片生成、视频生成、交互等能力持续突破,流量保持良好增长,根据Sensor Tower数据,2024年预计全球AI 下载量同比增长22%,全球AI应用内购收入同比增长50%。头部产品ChatGPT流量保持稳步提升,虽然在7月份流量一度环比 下滑,随着o1-preview和o1-mini的发布,但很快重返增长态势,月度访问量从年初的17亿次,提升到了11月接近40亿的月度水 平,流量较年初提升138%,12月ChatGPT周度活跃用户数突破3亿。
分类别看AI应用分为:底层设计逻辑的的AI原生产品、在原有互联网产品上深度嵌入AI功能的AI+X产品、基于外接API微创新 的套壳类产品和集合站类产品四大类。
硬件:AI硬件加速落地,AI眼镜成为关键载体
2024年,国内外AI+硬件的进程加快,小模型的发展推动AIPC、AI手机、AI眼镜、AI耳机等端侧硬件落地。2024年4月,Meta、微软、苹果等 集中发布Llama-3、Phi-3、OpenELM的等模型,此外MobileLLM、Gemma-7B、Qwen-7B、MiniCPM、TinyLlama等一系列端侧模型及小模型 相继问世。国内外各厂商对端侧布局的硬件布局也在2024年先后落地。在手机和电脑端,年初国内OPPO和vivo即推出AI手机,将部分AI功能集 成到手机终端,三星也在最新的S24系列中加入GalaxyAI的功能,12月苹果推出Apple Intelligence。在AIPC方面,联想、戴尔为代表的头部电 脑厂商开始在PC终端集成AI相关功能,配合全球芯片的发展,端侧计算和推理算力提升,联想PC端智能体AI Now的推出有望加速AIPC布局进 程。Gartner预测,2024年AI PC的出货量将达到4300万台,较2023年增长99.8%,2025年将达到1.14亿台,占PC总出货量的43%。
AI眼镜被视为AI端侧落地的关键硬件载体,引发广泛关注。去年9月,Meta发布Ray-Ban Meta,据The Verge统计,截至24年5月已经实现全球 销量100万副,成为首个消费级爆款AI硬件产品。AI眼镜作为轻量级的可穿戴产品,通常嵌入了耳机、摄像头、WiFi蓝牙模块等相关硬件以及生 成式人工智能模型应用,具备信息获取和交互的便捷性,相比于手机、电脑等传统电子终端,AI智能眼镜能够解放用户双手,提供更具沉浸式 的交互体验,是未来发展下AI部署的关键硬件载体。目前AI眼镜主要有三种技术路径,分别是AI、AR及AI+AR,以Ray-Ban Meta、Meta Orion、 Rokid Glasses为代表。
来源:未来智库一点号