在过去,大模型的发展遵循 Scaling Law,即通过增加数据量、模型参数和计算资源来提升模型性能,但随着AI发展,公有数据在预训练中的作用逐渐达到瓶颈。随着公开数据的利用逐渐饱和,单纯依靠增加数据规模和模型参数来提升性能的边际效益递减。这意味着,公开数据的预训练已经接近瓶颈,AI产业需要寻找新的增长点。一方面,可用于训练的高质量互联网公开数据逐渐稀少,数据增长已接近瓶颈 ;另一方面,继续单纯依靠增加公开数据量等方式来提升模型性能,边际效益递减,投入成本大幅增加但效果提升不明显AI 产业叙事向云厂商合作伙伴转移。AI产业的发展重心正在从单纯的大模型研发转向与云服务提供商(CSP)的合作。CSP厂商在数据、计算资源、模型部署等方面具有天然优势,能够为AI大模型提供全方位的支持。CSP厂商不仅提供云计算基础设施,还能通过其生态合作伙伴关系,帮助AI厂商更好地落地应用,形成从数据到模型、从训练到推理的完整闭环。摘要:在过去,大模型的发展遵循 Scaling Law,即通过增加数据量、模型参数和计算资源来提升模型性能,但随着AI发展,公有数据在预训练中的作用逐渐达到瓶颈。随着公开数据的利用逐渐饱和,单纯依靠增加数据规模和模型参数来提升性能的边际效益递减。这意味着,公开数据的
海外的谷歌、亚马逊,国内的字节、腾讯等云厂商巨头,拥有庞大的用户群体和丰富的业务生态,在数据积累、算力资源、技术研发等方面具备深厚基础。
(一)CSP厂商具有全面布局与商业闭环的优势1.从数据到模型:CSP厂商能够通过其平台获取和整合大量数据,为AI模型训练提供高质量的数据源。从数据收集与管理,到利用数据进行模型训练,再到基于模型的推理应用,以及从云端到终端设备的部署,云厂商及其合作伙伴能够实现全流程的覆盖,形成一个相互关联、协同发展的完美商业闭环,从而在 AI 产业中占据重要地位。CSP厂商提供强大的计算资源(如GPU/TPU集群),支持大规模模型的训练和推理。
3.云到端的商业闭环:
CSP厂商能够将AI模型部署到云端,并通过边缘计算等技术将能力延伸到终端设备,形成完整的商业闭环。
在特定领域(如医疗、金融、法律等)训练出高度专业化的“专家大模型”,需要更高精度和准确度的数据。公开数据往往无法满足这种需求,而私域数据(企业或行业内部的专有数据)和人工标注数据(经过专业标注的高质量数据)成为关键。未来,拥有私域数据和高质量标注数据的CSP厂商将在AI大模型的竞争中占据优势。
私域数据是企业或机构在自身业务运营过程中积累的独特数据,如电商平台的用户交易记录、社交媒体的用户行为数据、医疗机构的病例数据等。这些数据具有高度的针对性、准确性和相关性,能够为训练垂直化的 “专家大模型” 提供更精准的信息,有助于提升模型在特定领域的性能和表现,更好地满足用户在专业领域的需求。
3.与人工标注数据的结合
人工标注的数据可以进一步提高私域数据的质量和价值。通过专业人员对私域数据进行标注和整理,能够为模型训练提供更明确的指导和监督信号,尤其是在需要高精度判断的领域,使模型能够更准确地学习和理解数据中的特征和规律,从而在特定领域展现出更强大的推理和预测能力。
4.未来趋势
私域数据和人工标注数据将成为下一阶段大模型发展的核心竞争力,而CSP厂商由于其在数据获取、存储和处理方面的优势,将在这场竞争中占据主导地位。
(三)CSP 厂商的优势与机遇
1.数据资源掌控
CSP 厂商由于其业务特性,通常掌握着大量的私域数据。以字节为例,其旗下的今日头条、抖音等平台积累了海量的资讯、视频等数据,这些数据为字节在训练和优化豆包等大模型时提供了得天独厚的优势,使其能够在自然语言处理、内容推荐等领域取得出色的成果4。
2.算力与技术支持
CSP厂商在云计算、分布式计算、AI模型训练和部署等方面具有深厚的技术积累,能够为大模型的训练和推理提供高效的硬件支持和优化方案。同时,他们还可以通过自研加速卡等方式,降低算力成本,提高模型的训练和推理效率,进一步增强自身在大模型竞赛中的竞争力。
3.生态优势与商业应用拓展
CSP厂商能够整合上下游资源,形成从数据到应用的完整生态,帮助AI厂商快速实现商业化落地。CSP 厂商能够将大模型与自身的云服务、终端设备等业务深度融合,实现从云到端的全面布局,为用户提供更加智能化、个性化的产品和服务。例如,将大模型应用于智能客服、智能办公、智能家居等场景,不仅能够提升用户体验,还能够为 CSP 厂商带来新的商业机会和收入增长点。
在公开数据预训练的边际效益递减的情况下,AI产业需要寻找新的增长点。
CSP厂商凭借其在数据、计算资源和生态方面的优势,将成为AI大模型发展的关键推动者。
私域数据和人工标注数据将成为未来大模型竞争的核心资源,而掌握这些资源的CSP厂商将在下一轮竞赛中占据优势。
这一趋势表明,未来的AI竞争不仅是技术和算法的比拼,更是数据资源和生态能力的较量。
CSP厂商通过其全面的布局和资源优势,有望在AI产业中扮演更加重要的角色。
在A股上市的部分云服务提供商(CSP)厂商概念股:
用友网络(600588.SH)用友网络是国内领先的企业云服务提供商,主要提供ERP、财务云、HR云等服务,帮助企业实现数字化转型。金山办公(688111.SH)
金山办公通过其WPS云服务为企业提供云端办公解决方案,是A股上市的云服务相关企业。浪潮信息(000977.SZ)
浪潮信息是国内领先的云计算基础设施提供商,主要提供服务器、存储等云服务相关硬件和解决方案。宝信软件(600845.SH)
宝信软件专注于工业互联网和云计算服务,为企业和政府提供云解决方案,尤其在钢铁、交通等领域有较强优势。光环新网(300383.SZ)
光环新网是国内知名的数据中心和云计算服务提供商,主要提供IDC(互联网数据中心)和云服务。优刻得(688158.SH)
优刻得(UCloud)是国内领先的中立云计算服务商,提供公有云、私有云和混合云解决方案,主要服务于中小企业。神州数码(000034.SZ)
神州数码通过其云业务为企业提供云迁移、云管理和云优化服务,是云计算领域的重要参与者。东华软件(002065.SZ)
东华软件提供云计算和大数据解决方案,主要服务于金融、医疗、政府等行业。中科曙光(603019.SH)
中科曙光是国内领先的高性能计算和云计算服务提供商,主要提供服务器、存储和云计算解决方案。太极股份(002368.SZ)
太极股份为政府和大型企业提供云计算和数字化转型服务,是国内重要的云服务厂商之一。
(豆包和Deepseek对本文亦有贡献)
声明:
1.本号内容在于分享信息和供本号相关人员随时查阅,除原创文章外其它内容不代表本号观点或立场;分享的信息仅供参考,不构成投资及交易建议,如使用请自行核实,据此操作,风险自担。
2.本号分享的未知来源的信息如有侵权,请及时私信联系,本号将及时处理!
来源:花明