摘要:2025年9月26日,国家发展改革委等部门联合印发的《关于加强数字经济创新型企业培育的若干措施》(以下简称《措施》)在业界激起千层浪。这份文件不仅为数字经济的未来划定了跑道,更清晰地指出了一个极具潜力的风口——垂类大模型。它被明确列为国家培育数字经济创新型企业
【亿邦原创】2025年9月26日,国家发展改革委等部门联合印发的《关于加强数字经济创新型企业培育的若干措施》(以下简称《措施》)在业界激起千层浪。这份文件不仅为数字经济的未来划定了跑道,更清晰地指出了一个极具潜力的风口——垂类大模型。它被明确列为国家培育数字经济创新型企业的重点领域,标志着人工智能的发展重心,正从追求“大而全”的通用能力,向深耕“小而美”的行业纵深战略性转移。
产业互联网历经十年耕耘,初步完成了企业“上云用数”的流程数字化阶段。然而,在从“连接”走向“赋能”,从“效率提升”走向“价值创造”的深水区,它遭遇了瓶颈。此时,垂类大模型的横空出世,仿佛为产业互联网的下一步演进提供了一个重要选项。
垂类大模型:产业互联网的“天命所归”?
在理解这场变革之前,我们必须首先厘清:什么是垂类大模型?
垂类大模型与ChatGPT、文心一言等通用大模型有着本质区别。通用大模型是“通才”,知识面广博,能进行日常对话、创作诗歌、解答常识问题,但其知识深度和专业性有限,难以应对严谨的工业场景。而垂类大模型是“专家”,它是针对特定行业或领域(如金融、医疗、制造、法律、交通等)进行深度优化和定制训练的人工智能模型。它通过深度融合行业的专业知识、业务规则、流程逻辑以及海量的场景数据,实现在特定领域内的精准认知、判断与决策。
垂类大模型的特征可以概括为三点,即:第一,是专业性。垂类大模型的“大脑”里填充的不再是互联网的通用语料,而是行业文献、专利库、设备操作手册、工艺流程图纸、专家诊断报告、法律判例等“高营养”的专业知识。这使得它能理解“渗碳体析出对轴承钢疲劳寿命的影响”这类专业问题,而不会将其误解为一种化学实验。
第二,是合规性。产业应用对合规、安全、可控的要求极高。垂类大模型在设计之初就将行业规范、安全标准和监管要求内嵌于模型之中,其决策过程可追溯、可审计,输出结果稳定可靠,避免了通用大模型常有的“幻觉”在工业场景中可能引发的巨大风险。
第三,是场景适配性。垂类大模型需要直接嵌入到具体的业务场景中。例如,在钢铁行业,它可能是一个嵌入到高炉控制系统中的“工艺优化专家”,实时分析上千个传感器数据,动态调整参数以降低能耗;在医疗领域,它则是一个辅助医生进行医学影像分析的“诊断助手”,能精准识别病灶,提示罕见病例。
以上的特质,与产业互联网的智能化发展方向形成了高度的“命运重合”。产业互联网的核心使命,是通过数字技术重构产业链、价值链,提升全要素生产率。其早期阶段,重在“连接”与“流程在线”,实现了交易的撮合、供应链的协同和管理的可视化。然而,这仅仅是“躯体”的数字化。产业的真正痛点——如工艺优化、故障预测、个性化定制、供应链弹性等——需要的是“大脑”的智能化。垂类大模型,完全可以看作是为产业互联网装上这样一个专业化“大脑”的最佳载体。
因此,政策与技术在此时交汇,并非偶然。它预示着,产业互联网的竞争下半场,将从平台的规模效应,转向模型的深度智能。然而,从“平台”跃迁至“模型”,绝非一蹴而就,其间的鸿沟,正由“数据要素”这一核心因素所决定。
第一关:数据质量关——从“原始矿藏”到“标准粮仓”
产业互联网平台经过多年积累,坐拥海量行业数据,这本是培育垂类大模型最宝贵的“沃土”。但现实情况是,这些数据大多仍处于“原始矿藏”状态,若直接用于模型训练,无异于用含杂质的粮食喂养一个天才婴儿,结果必然是“模型智障”。
数据质量关,是产业互联网迈向垂类大模型必须打赢的第一场“预备役”。其挑战主要体现在四个维度,其一是一致性。产业数据来源众多,传感器、ERP、MES、SCM等系统各自为政,数据格式、标准、时间戳千差万别。同一台设备,在A系统叫“反应釜001”,在B系统可能叫“R-001”,温度单位是摄氏度还是华氏度也可能混淆。这种“方言”林立的现象,使得数据难以统一理解和处理。
其二,是准确性。产业互联网具体场景和实现差异较大,系统数据管理、人工录入错误等,导致数据中存在大量噪声、异常值和缺失值。一个基于有偏差的历史 数据训练的模型,其做出的预测和决策,可靠性很难让人放心可言。
其三,是高效率的数据标注匮乏。监督学习是训练垂类大模型的主流方式,这需要大量被准确标注的数据。例如,要训练一个设备故障预测模型,就需要大量标记了“正常”、“预警”、“故障”及其具体类型的设备运行数据。在产业领域,这种标注极度依赖行业专家的经验,成本高昂、周期漫长,形成了“有多少标注数据,就有多智能的模型”的瓶颈。
其四,是时效性。许多产业场景,如工艺优化、实时调度、故障预测,要求模型能够基于最新、甚至实时的数据做出决策。然而,传统的数据集成方式往往是T+1(甚至是+N)的批处理,数据从产生到可被模型使用存在数小时甚至数天的延迟,这导致模型总是在分析“过去时”的数据。
突破数据质量关,要求产业互联网平台必须从“数据汇集者”升级为“数据治理专家”。这意味着要构建一套体系化的数据治理框架。首先,是要建立产业数据标准体系。其次,要强化部署智能的数据清洗与增强管道。最后,需要创新人机协同的数据标注模式。开发高效的标注工具,将专家知识沉淀为标注规则,利用“AI预标注+专家审核”的模式,大幅提升标注效率,降低标注成本。
唯有通过一番深度数据治理,将杂乱无章的“数据湖”转变为洁净、规整的“数据仓”,产业互联网平台才能为垂类大模型提供合格的“食粮”,迈出智能化的第一步。
第二关:数据资产化关——构造新的服务价值引擎
跨过数据质量关,我们面对的是一座更难以逾越的关隘——数据资产化关。如果说数据质量关乎模型的“智商”,那么数据资产化则关乎整个商业模式的“灵魂”。它要解决的,不仅是数据“能用”的问题,更是数据“值钱”、并能公平“分钱”的问题。
当前产业互联网平台面临的核心悖论在于:它们运营着海量的、蕴含巨大价值的数据,但这些数据从产权归属上看,却存在模糊地带。平台上的企业用户是其数据的生产者,平台是数据的聚合与处理者。如果严格按照数据资产“权属清晰、可控制、可交易、能带来经济利益”的标准来衡量,平台所控制的许多核心数据资源,其权利并不完全清晰。
这一悖论导致了平台的“战略犹豫”。对推动数据的完全资产化有疑虑,因为那意味着要直面产权界定的难题。然而,垂类大模型的崛起,正在倒逼这一问题的解决。训练和运营一个高质量的垂类大模型,需要持续、巨额的投资。如果模型所产生的价值无法通过清晰的资产化路径回馈给数据提供方和模型开发方,那么整个商业闭环就无法成立。
因此,突破数据资产化关,需要一场对生产关系的深刻变革。譬如,更清晰的产权界定与利益分配机制创新;更准确 的数据资产的价值评估与计价;更可信的数据流通环境。等等
只有完成了从“数据资源”到“数据资产”的惊险一跃,产业互联网平台才能解开束缚数据价值的精神枷锁,激活生态内所有参与者的共享热情,为垂类大模型注入源源不断的燃料与动力。
第三关:数据多维融合创新关——实现新场景下的系统智能
拥有了高质量、已资产化的数据,是否就能孕育出卓越的垂类大模型?答案恐怕是还不够。真正的产业智能,绝非在单一数据源、单一场景下的“小聪明”,而是融合了多维度知识,能够应对复杂系统的“大智慧”。这便是第三关——数据多维融合创新关,也就是实现系统智能。
如果产业互联网平台只能提供孤立的交易数据或设备数据,那么训练出的模型只能是“管中窥豹”,其应用价值将大打折扣。突破此关,要求产业互联网平台必须具备“数据融合”的战略视野与技术能力,构建起以数据资产增值生值为核心理念的数据治理体系。这套体系的核心任务包括:打破内部数据孤岛,实现平台内部,交易、物流、金融、生产等不同业务线条数据的打通与关联分析,形成统一的客户视图和业务视图;引入外部知识增强,积极引入行业知识图谱、专利库、科研论文等外部结构化知识,将企业的私有数据与人类的公共知识相结合,赋予模型更深度的推理能力;构建融合性应用场景,主动设计和开拓需要多源数据融合的创新应用。例如,与气象服务商合作,为农业客户提供“气候-土壤-市场”一体化的种植决策建议;与金融机构合作,基于真实的供应链运营数据,为企业提供更精准的动态授信和保险服务。
通过多维数据的交叉碰撞,才能激发“1+1>2”的创新效应,使得垂类大模型不再是解决单一问题的工具,而是成为驱动整个产业链价值重构的“神经中枢”。
总的来看,垂类大模型作为产业互联网智能化演进的关键载体,其地位已毋庸置疑。然而,这条通往未来的康庄大道上,矗立着数据质量、数据资产化和数据多维融合三座必须征服的关隘。产业互联网的未来,或许就是垂类大模型。但更准确地说,是属于那些成功跨越了“数据三关”,真正将数据转化为核心资产的垂类大模型。这场征程,始于数据,成于治理,终于智能。亿邦智库将持续关注数创企业的培育与创新发展,将持续跟踪报道有关数据产业创新发展、企业数据治理、创新案例和试验区发展的新成果和新案例。
联系邮箱为:huangbin@ebrun.com
来源:亿邦动力一点号