狂砸百亿美元后,仅5%企业成功落地AI,他们做对了什么?

B站影视 港台电影 2025-08-27 18:23 2

摘要:据 MIT 的最新一份调查报告,企业在生成式 AI(GenAI)领域投入了数百亿美元,但 95%的机构未能从中获得任何可衡量的商业回报。大多数 AI 试点项目陷入停滞,没能对企业的财务业绩产生可见贡献。MIT 把这种现象,称为「GenAI 鸿沟(Divide)

引入各类 AI 工具,全员使用 AI ,几乎已经成为当下公司「All in AI」的标准第一步了。

那 AI 在公司层面的实际落地效果如何?

据 MIT 的最新一份调查报告,企业在生成式 AI(GenAI)领域投入了数百亿美元,但 95%的机构未能从中获得任何可衡量的商业回报。大多数 AI 试点项目陷入停滞,没能对企业的财务业绩产生可见贡献。MIT 把这种现象,称为「GenAI 鸿沟(Divide)」。

而导致实际落地效果不佳的核心瓶颈源于绝大多数的 AI 工具普遍缺乏「学习」能力,它们无法记忆用户反馈、适应具体工作情境,也无法在使用中持续迭代优化。导致难以与用户的工作流集成,脱离了实际的工作流程。

此外,公司内部的 GenAI 预算分配失衡、通用 AI 工具无法支撑核心业务场景、员工更倾向于个人使用消费级 AI 工具......也是导致「GenAI 鸿沟」的原因。

那成功落地 AI 工具且产生实际效应的少数企业都做对了什么?

成功的企业往往聚焦「范围窄但价值高」的用例,将 AI 深度融入到工作流中,并通过持续学习实现规模化推广,而不是追求功能广度。AI 对于业务领域的熟悉度和工作流集成能力,比炫酷的用户界面更重要。

选择「部署门槛低、价值实现快」的 AI 工具,往往比复杂的企业级定制开发更有效。

不再把 AI 当成 SaaS 软件来采购,而是像对待业务流程外包(BPO)伙伴一样,要求供应商提供能深度融入业务、并为最终业务成果负责的定制化服务。

最成功的 AI 项目往往不是由总部的创新部门推动的,而是由一线业务经理为解决实际痛点而主导发起的,他们最懂业务,也最知道工具好不好用。

放弃从零开始内部开发的想法,选择与外部供应商合作的成功率是内部开发的两倍,能够更快地实现价值并降低风险。

不要试图开发一个庞大而复杂的平台,而是从一个「小而美」的切入点开始,针对一个具体的工作流,做一款能快速部署、快速见效的工具。

最快、最可观的投资回报,往往不在于削减内部员工成本,而在于替代那些昂贵的外部机构和业务流程外包(BPO)服务,尤其是在后台运营部门。

以下为《The GenAI Divide: State of AI in Business 2025》报告详细内容,Founder Park 进行了编译和适当调整。

01 企业们的「GenAI 鸿沟」现象

尽管企业在生成式 AI(GenAI)领域的投资规模已高达 300 亿至 400 亿美元,但通过调研,我们发现: 95%的机构未能从中获得任何可衡量的商业回报。 无论是在需求方(包括大型、中型及小型企业)还是在供给方(包括初创公司、技术供应商及咨询机构),项目的最终成效都出现了巨大分化。我们将此现象定义为「GenAI 鸿沟」。

数据显示,仅有 5%的 AI 集成试点项目成功创造了百万美元级别的商业价值,而绝大多数项目则陷入停滞,未能对企业的财务业绩产生可见贡献。值得注意的是,造成这种鸿沟的根本原因并不是因为模型技术或外部监管,而是企业内部的实施路径与方法。

以 ChatGPT、Copilot 为代表的通用型工具已被广泛采用。超过 80%的机构进行过探索或试点,其中近 40%表示已在内部部署。但这类工具的价值主要体现在提升个人生产力,并未有效转化为企业层面的财务收益。与此同时,专门为企业设计的系统(无论是内部定制开发还是外部采购)都普遍遭遇了部署困境。60%的机构曾对这类系统进行评估,但仅有 20%进入试点阶段,最终成功投入生产环境的只有 5%。项目失败的核心原因普遍指向三点: 工具固化、无法结合具体场景学习,以及脱离实际工作流程。

通过对 153 位企业高管的访谈、调研以及对 300 个公开案例的分析,我们总结出了「GenAI 鸿沟」的四大典型特征:

行业变革迟缓: 在 8 个主要行业中,仅有 2 个出现了显著的结构性变革。

大企业的规模化困境: 大型企业在试点项目数量上遥遥领先,但在规模化应用上却明显落后。

投资失衡: 预算资源倾向于投入成果可见的前端职能(如销售与营销),而不是投资回报率(ROI)更高的后台部门。

外部合作成效显著: 采用外部合作模式的项目,其成功率是内部独立开发项目的两倍。

我们发现,阻碍规模化应用的核心障碍,并非基础设施、监管或人才,而是大多数 GenAI 系统普遍缺乏「学习」能力,它们无法记忆用户反馈、适应具体工作情境,也无法在使用中持续迭代优化。

少数成功的供应商和采购方,正是通过正视并着力解决上述局限性,才取得了更快的进展。成功的采购方会要求供应商提供针对特定流程的定制化方案,并基于业务成果而非软件技术基准来评估其价值。他们期望系统不仅能融入现有流程,更能持续学习和优化。能够满足这些需求的供应商,往往能在数月内达成百万美元级的部署合作。

尽管多数 AI 项目并未直接导致裁员,但在那些已成功跨越鸿沟的企业中,我们观察到 AI 已对特定岗位的人员结构产生了影响,尤其是在客户支持、软件工程和行政职能领域。此外,领先企业报告称,最直接的成本节约来自于 减少对外部服务的依赖 ,例如削减业务流程外包(BPO)和咨询机构的开支,尤其是在后台运营方面。同时,部分企业通过自动化客户触达和智能跟进,实现了客户留存率和销售转化率的提升。

这些初步成功案例表明,只要将具备学习能力的系统应用于特定业务流程,即使不进行大规模的组织架构调整,也能够创造出切实的商业价值。

02 高采用率、低转化率,
仅有 5% 的企业定制 AI 工具能实现投产

核心结论: 大多数机构处于「GenAI 鸿沟」的劣势方,工具采用率高,但变革效果差。 9 个行业中,有 7 个行业几乎未出现结构性变革。 企业虽在试点使用 GenAI 工具,但极少能实现部署。ChatGPT 等通用工具的使用范围广泛,而定制解决方案因集成复杂且与现有工作流程不匹配,陷入停滞。

观察行业层面的变革模式,「GenAI 鸿沟」的现象最为明显。尽管存在高关注度的投资和广泛的试点活动,但仅有少数机构能超越试验阶段,实现有意义的业务变革。

2.1 「GenAI 鸿沟」背后的现状

核心结论: 尽管 GenAI 备受关注,但 「GenAI 鸿沟」 在行业层面体现得十分显著。仅有两个行业(科技和媒体)出现了明确的结构性变革迹象,其余 7 个行业均处于变革的劣势方。

尽管存在高关注度的投资,行业层面的变革仍十分有限。GenAI 已被应用于支持服务、内容创作和数据分析等场景,但很少有行业出现类似以往通用技术(如催生新市场领导者、颠覆商业模式或改变客户行为)带来的深度结构性变革。

为更精准地量化变革现状,我们构建了 「AI 市场变革指数」(AI Market Disruption Index)。基于 5 个可观察指标,对每个行业进行 0-5 分的评分。这些分数是对 5 个维度的标准化平均值,综合了公开指标和访谈评估结果。我们还测试了不同的权重方案,以确保行业排名的一致性:

2022-2025 年头部企业的市场份额波动情况

2020 年后成立的 AI 原生企业的收入增长情况

AI 驱动的新商业模式的涌现情况

可归因于 GenAI 的用户行为变化

可归因于 AI 工具的高管组织架构调整频率

表:各行业 GenAI 变革差异显著(指数范围:0-4)

表:GenAI 变革情况说明

敏感性分析: 我们对 5 个变革指标的权重进行了测试。在所有合理的权重方案下,科技行业和媒体与电信行业始终位居前列,而医疗健康行业和能源行业则始终排名靠后。专业服务行业的排名对权重变化最为敏感,根据对 「效率提升」 和 「结构性变革」 的权重侧重不同,其指数在 1.2-2.1 之间波动。

9 个主要行业中,有 7 个行业开展了大量试点活动,但几乎未出现结构性变革。这种投资与变革之间的差距,直接体现了规模化的 「GenAI 鸿沟」—— 广泛的试验活动并未带来相应的变革效果。

受访者之一,某中端市场制造企业的首席运营官(COO)总结了普遍观点:

「领英(LinkedIn)上的宣传称一切都已改变,但在我们的实际运营中,根本没有发生根本性变革。我们只是加快了部分合同的处理速度,仅此而已。」

2.2 从试点到投产的鸿沟

核心结论: 「GenAI 鸿沟」 在部署率上体现得最为显著, 仅有 5% 的企业定制 AI 工具能实现投产。 聊天机器人之所以能推广,是因为易于试用且灵活性高,但由于缺乏记忆能力和定制化功能,它们在关键工作流程中表现不佳。这一根本性差距,正是大多数机构处于鸿沟劣势方的原因。

我们的研究发现,从探索 GenAI 工具、开展试点项目到实际实施,过程中的参与度大幅下降,且通用解决方案与定制解决方案之间存在显著差异。

研究局限性: 这些数据基于个人访谈得出,虽能反映整体趋势,但并非官方企业报告。不同类别的样本量存在差异,且各机构对 「采用成功」 的定义也可能不同。

图表:特定任务的 GenAI 工具从试点到投产的参与度大幅下降

通用大型语言模型(General-Purpose LLMs):探索阶段 80%、试点阶段 50%、成功实施阶段 40%

嵌入式或特定任务型 GenAI (Embedded or Task-Specific GenAI):探索阶段 60%、试点阶段 20%、成功实施阶段 5%

研究说明: 对于特定任务型 GenAI 工具,我们将 「成功实施」 定义为用户或高管认为该工具对生产力和 / 或损益表产生了显著且持续影响的情况。

企业 AI 解决方案 95% 的失败率,是 「GenAI 鸿沟」 最明显的体现。处于鸿沟劣势方的机构仍在投资无法适应其工作流程的静态工具,而跨越鸿沟的机构则将重点放在具备学习能力的系统上。

通用 LLMs 聊天机器人的试点到实施转化率看似较高(约 83%),但这掩盖了其在感知价值上的深层差距,也解释了为何大多数机构仍被困在鸿沟的劣势方。

在访谈中,企业用户对 ChatGPT、Copilot 等消费级工具的评价普遍积极。这些系统因其灵活性、易用性和即时实用性而受到好评。然而,正是这些用户,对定制化或供应商推荐的 AI 工具普遍持怀疑态度,认为它们僵化、过度设计或与实际工作流程不匹配。

正如某首席信息官(CIO)所言:「今年我们已经看了几十场演示,真正有用的可能只有一两个,其余的要么是简单包装,要么是纯粹的技术实验。」

尽管热情和预算通常足以启动试点项目,但将其转化为融入工作流程且能持续创造价值的系统,却十分罕见 —— 这正是处于鸿沟劣势方的机构的典型经历。

本文所定义的 大型企业 (年营收超过 1 亿美元的公司)在试点项目数量上领先,且为 AI 相关项目分配了更多人力 。但这种投入强度并未转化为成功, 这些机构的试点项目规模化转化率最低。

相比之下,中端市场企业的行动更为迅速果断。表现最佳的中端市场企业报告称,从试点到全面实施的平均时间仅为 90 天,而大型企业则需要 9 个月甚至更长时间。

企业 GenAI 的五大误区

未来几年 AI 将取代大多数工作岗位→研究发现,GenAI 导致的裁员现象十分有限,且仅发生在已受 AI 显著影响的行业。对于未来 3-5 年的招聘规模,高管们尚未达成共识。

GenAI 正在改变商业格局→工具采用率高,但变革效果罕见。仅有 5% 的企业实现了 AI 工具在工作流程中的规模化集成,且 9 个行业中有 7 个未出现真正的结构性变革。

企业在采用新技术方面行动迟缓→企业对采用 AI 的意愿极强,90% 的企业已认真考虑购买 AI 解决方案。

阻碍 AI 发展的最大因素是模型质量、法律、数据和风险问题→真正的阻碍在于,大多数 AI 工具无法学习,且难以与工作流程集成。

最优秀的企业会自主开发工具→内部开发项目的失败率是外部合作的两倍。

2.3 影子 AI 经济:员工个人使用 AI 工具实现工作自动化

核心结论: 尽管企业官方的 AI 项目仍被困在鸿沟的劣势方,但员工已通过个人 AI 工具跨越了这一鸿沟。这种「影子 AI(Shadow AI)」往往比正式项目带来更高的投资回报率,也揭示了弥合鸿沟的有效路径。

在企业 AI 部署数据不尽如人意的背后,存在一个令人意外的现实: AI 其实已在改变工作方式 只是并非通过官方渠道。 我们的研究发现了一个活跃的 「影子 AI 经济」:员工使用个人的 ChatGPT 账号、Claude 订阅服务及其他消费级工具,自动化完成大量工作任务,且往往无需信息技术(IT)部门的知情或批准。

其规模令人惊叹。尽管仅有 40% 的公司表示购买了官方的 LLMs 订阅服务,但在我们调查的公司中,超过 90% 的员工报告称会定期使用个人 AI 工具处理工作任务。事实上,几乎所有受访者都在以某种形式使用 LLMs 辅助工作。


图表:影子 AI 经济,员工使用率远超官方采用率

在许多情况下,使用影子 AI 的员工表示,他们每天都会通过个人工具多次使用 LLMs 处理工作,而其所在公司的官方 AI 项目却仍停留在试点阶段。

这种影子经济表明,当员工能够使用灵活、响应迅速的工具时,个人完全可以成功跨越「GenAI 鸿沟」。那些认识到这一模式并加以利用的机构,代表了企业 AI 采用的未来方向。

具有前瞻性思维的机构正开始弥合这一差距:通过分析影子 AI 的使用情况,识别哪些个人工具能创造价值,再采购相应的企业级解决方案。

2.4 企业内部投资 AI 主要集中在销售和营销领域

核心结论: 投资分配情况直观体现了 「GenAI 鸿沟」,50% 的 GenAI 预算流向销售和营销部门,但后台自动化往往能带来更高的投资回报率。这种偏向源于指标易于量化,而非实际价值,导致机构将重点放在了非核心优先级上。

从功能重点来看,GenAI 工具的投资高度集中。由于目前各机构尚未正式量化 GenAI 支出,我们请高管们假设分配 100 美元预算到不同职能部门。 调查结果显示,销售和营销部门约占各机构 AI 预算分配的 70%。

图表:GenAI 投资的职能分布(按职能及具体用例划分)

研究说明: 尽管高管访谈中,GenAI 投资的总体职能分配(如约 50% 流向销售与营销)相对一致,但具体子类别和用例的细分数据仅作参考,不能完全精确反映实际情况。子类别基于综合记录和案例模式,而非精确核算。企业类型对投资分配影响显著:例如,制造企业和医疗服务提供商通常对销售与营销的投资极少,而对运营的投资占比过高;科技和媒体企业往往优先投资营销、内容和开发者生产力领域;专业服务企业则倾向于文档自动化和法律 / 合规工具。

销售和营销部门之所以占据投资主导地位,不仅因为其可见性高,还因为成果易于量化:演示数量、邮件响应时间等指标能直接对应董事会层面的关键绩效指标(KPI)。

相比之下,法律、采购和财务部门能带来的效率提升更为隐性,例如减少合规违规、优化工作流程或加快月末结算流程等。这些改进虽重要,但难以在高管会议或投资者更新报告中重点体现。

某财富 1000 强制药企业的采购副总裁清晰地阐述了这一挑战:

「如果我购买一个工具来提高团队的工作效率,该如何量化这种影响?当它无法直接拉动收入或降低可量化成本时,我该如何向首席执行官(CEO)证明这笔投资的合理性?我或许可以说它能帮助科学家更快获得所需工具,但这与最终利润的关联太过间接。」

这种投资偏向导致资源流向可见性高但变革性较弱的用例,而后台部门中投资回报率最高的机会却得不到足够资金支持,进一步加剧了 「GenAI 鸿沟」。

除了衡量难题,信任和社会认同也是采购决策中的关键因素。某大型快消品(CPG)企业的采购负责人道出了许多采购方面临的困境:

「我每天都会收到无数封邮件,声称提供最优质的 GenAI 解决方案。有些演示确实令人印象深刻,但建立信任才是真正的难题。面对如此多的选择,我们在很大程度上依赖同行推荐和人脉网络中的介绍。」

这凸显了一个更普遍的模式:产品质量本身往往不足以促成采购决策。推荐、过往合作关系和风险投资(VC)介绍,比功能或特性更能影响企业的采用决策。

03 AI 还不具备适应业务和记忆能力, 导致 GenAI 试点难以推进

核心结论: 导致企业困在「GenAI 鸿沟」劣势侧的 核心因素是 学习差距 」, 工具无法学习、难以与现有流程集成,或与工作流不匹配。 用户会选择 ChatGPT 处理简单任务,但在关键业务工作中会放弃使用,因为它缺乏记忆能力。 当前缺失的是具备适应、记忆和进化能力的系统 ,而这些能力正是区分鸿沟两侧的关键所在。

3.1 核心障碍

核心结论: 阻碍企业跨越鸿沟的首要因素,恰恰体现了「GenAI 鸿沟」的核心「学习差距」:用户抵制不适应的工具,模型在缺乏上下文时质量不佳,系统无法记忆信息则会导致用户体验变差。即便是 ChatGPT 的忠实用户,也对无法满足其预期的企业内部 GenAI 工具缺乏信任。

为探究为何多数 GenAI 试点项目难以突破试验阶段,我们对 52 家企业的项目负责人和一线用户展开了调研。参与者需对影响规模化推广的常见障碍按「1-10 分」评分(10 分代表最常遇到的障碍)。

结果显示,「员工抗拒采用新工具」是最主要的障碍,然而,排名第二的障碍的影响程度更大。

表:企业规模化应用 AI 的主要障碍

研究说明: 上述评分反映的是「障碍出现频率」,而不是对障碍影响程度的客观衡量,且可能因行业和企业规模不同而存在显著差异。

「模型输出质量担忧」成为高频障碍,这一结果初看与现实矛盾。ChatGPT 等消费级工具的用户渗透率已大幅提升,超过 40%的知识工作者会个人使用 AI 工具。但正是这些将 AI 工具融入个人工作流的用户,却认为企业内部系统中的同类工具不可靠,这种矛盾恰恰体现了用户层面的「GenAI 鸿沟」。

这种偏好差异揭示了一个核心矛盾:每天使用 ChatGPT 处理个人事务的专业人士,在企业工作中却要求工具具备学习和记忆能力。大量员工已通过私人渠道使用 AI 工具,并体验到了 productivity 提升,但企业官方的 GenAI 项目却陷入停滞。这种「影子使用」形成了恶性循环: 员工清楚优质 AI 工具的体验,因此对功能僵化的企业工具更难接受。

3.2 通用工具的优劣势

核心结论: 「GenAI 鸿沟」同样体现在用户偏好上:即便采用相似模型,ChatGPT 仍凭借「更好用、更快速、更熟悉」的优势击败企业级工具。但这种偏好也暴露了企业困在鸿沟劣势侧的原因: 通用工具虽能满足基础需求,却无法支撑核心业务场景。

后续访谈中,我们发现了一个明显的矛盾现象: 对企业 AI 工具持怀疑态度的专业人士,往往是消费级 LLMs 的高频用户。 当被要求对比两种工具的使用体验时,他们提到了三个共性观点。

图表:用户偏好的驱动因素:通用大型语言模型界面与集成工具

某中型企业的公司法务就是典型案例:其所在企业斥资 5 万美元采购了专业合同分析工具,但她在起草文件时仍坚持使用 ChatGPT。

「我们采购的 AI 工具只能生成固定格式的摘要,几乎没有定制空间。而用 ChatGPT 时,我可以引导对话方向,反复调整直到得到满意的结果。两者的质量差距很明显——尽管供应商声称使用了相同的底层技术,但 ChatGPT 的输出结果始终更优。」

这一现象表明,对于即时可用性和用户满意度而言,每月 20 美元的通用工具往往优于成本高几个数量级的定制化企业系统。这种矛盾正是多数企业困在「GenAI 鸿沟」劣势侧的典型体现。

3.3 「学习差距」:GenAI 缺乏记忆和适应能力

核心结论: ChatGPT 的局限性恰恰揭示了「GenAI 鸿沟」的核心问题:它无法记住上下文、不能通过学习优化,也不具备进化能力。在关键业务场景中,90%的用户更倾向于选择人类而非 AI 。这种差距是结构性的,GenAI 缺乏记忆和适应能力。

既然用户偏好消费级 LLMs 界面,我们进一步探究了「为何这类工具难以在关键业务场景中大规模应用」。结果显示,此类场景的障碍与通用可用性问题截然不同,且直接指向了定义「GenAI 鸿沟」的 「学习差距」。

图表:核心工作流集成的障碍

前文提到的那位偏好 ChatGPT 的法务,在处理敏感合同时态度发生了明显转变:

「ChatGPT 非常适合头脑风暴和初稿撰写,但它记不住客户的偏好,也不会从之前的修改中学习——总是重复犯同样的错误,每次使用都需要重新输入大量背景信息。对于高风险工作,我需要一个能积累知识、持续优化的系统。」

这段反馈直指「学习差距」这一核心问题,正是这一差距让企业困在「GenAI 鸿沟」的劣势侧。用户认可消费级 LLMs 界面的灵活性和响应速度,但 关键业务场景需要的 持续性 上下文感知能力 ,却是当前工具无法提供的。

当我们询问企业用户「高风险任务更适合交给 AI 还是初级员工」时,偏好层级变得十分清晰:

图表:高风险任务的适用性评估

结果显示,AI 已在简单任务场景中占据优势: 70%的用户倾向于用 AI 起草邮件,65%会用它进行基础分析。但在复杂或长期任务中,人类的优势高达 9:1。 两者的分界线并非「智能水平」,而是「记忆能力、适应能力和学习能力」——这些正是区分「GenAI 鸿沟」两侧的核心特征。

「智能体 AI 」(Agentic AI)是专门解决「学习差距」的系统类型,其设计核心就是嵌入持久记忆和迭代学习能力。与当前「每次使用都需重新输入完整上下文」的系统不同,智能体系统能保持持久记忆、从交互中学习,还能自主协调复杂工作流。目前已有企业开展早期试验:例如能全程独立处理客户咨询的客服智能体、监控并审批常规交易的财务处理智能体、跨渠道跟踪客户互动的销售流程智能体,这些案例均证明,「自主性」和「记忆能力」能有效解决企业面临的核心痛点。

图表:根据定制和学习能力定位广义人工智能工具

04 相比复杂的企业定制, 「部署门槛低、价值实现快」的工具更有效

核心结论: 处于「GenAI 鸿沟」优势侧的企业,都采用了一套共性方法:构建能够从反馈中学习的自适应、嵌入式系统。成功跨越鸿沟的初创企业,会 聚焦 范围窄但价值高 的用例,深度融入工作流 ,并通过持续学习实现规模化推广,而非追求功能广度。 对业务领域的熟悉度和工作流集成能力,比炫酷的用户界面更重要。

访谈中我们发现,GenAI 初创企业正逐渐分化:部分企业仍沿用过时的 SaaS(软件即服务)运营模式,困在鸿沟劣势侧;另一部分则通过深度定制和解决实际业务痛点,成功吸引了企业客户的关注。

企业对 GenAI 工具的需求依然旺盛。多家初创企业表示,能在几天内敲定试点合作,且短期内就能实现百万美元级别的年化收入。表现突出的企业并非开发通用工具,而是通过嵌入客户工作流、适应上下文环境,从「范围窄但价值高」的场景切入,逐步实现规模化。

数据显示,成功的企业和供应商都在积极解决「学习能力、记忆能力和工作流适应性」问题;而 失败的企业要么开发通用工具,要么尝试内部自主搭建能力。

成功的初创企业会构建「能从反馈中学习」(66%的高管有此需求)、「能保留上下文」(63%的高管要求此功能)且「能深度定制以匹配特定工作流」的系统。它们通常从工作流的边缘场景切入,先通过高度定制化实现突破,再逐步拓展至核心流程。

4.1 企业如何选择 GenAI 工具

最成功的供应商深知,要跨越「GenAI 鸿沟」, 必须构建 能在使用环境中学习和优化 的系统——这正是高管们反复强调的核心需求 ,而非仅仅是「生成内容」的工具。

在评估 AI 工具时,采购方会重点关注一系列明确的优先级。我们通过访谈整理并量化了这些在采购决策中高频出现的因素:

图表:高管如何选择 GenAI 供应商

图表:高管们对于 GenAI 供应商的需求

与预期不同,「对员工的影响」并非是企业主要担忧。多数用户对自动化持欢迎态度(尤其是处理繁琐的手动任务时),只要能保证数据安全且成果可衡量。

尽管传统观点认为「企业抗拒训练 AI 系统」,但 访谈中的多数团队表示,只要收益明确且有安全保障,他们愿意参与系统训练。

此外,企业对新兴供应商(尤其是高信任度或受监管场景中的供应商)普遍持怀疑态度。多位采购负责人表示,无论创新程度如何,他们都会忽略大多数初创企业的合作提案。

「我们每天都会收到几十封关于‘AI 驱动采购工具’的邮件。但我们长期合作的业务流程外包(BPO)伙伴已经熟悉我们的政策和流程,所以我们更愿意等他们推出 AI 增强版服务,而不是换成未知的供应商。」——某全球快消品企业采购负责人。

4.2 如何成功引用 GenAI 工具

核心结论: 成功跨越「GenAI 鸿沟」的初创企业,会先在「范围窄的工作流」中实现小规模的显性成果,再逐步拓展。 部署门槛低、价值实现快 的工具,比复杂的企业级定制开发更有效。 渠道推荐和同行信任,是弥合鸿沟的关键增长杠杆。

最成功的初创企业通过两种策略,既满足了「企业对学习型系统的需求」,又解决了「对新工具的信任问题」:

4.2.1 针对特定工作流定制工具

成功的关键在于:先嵌入「非核心或辅助流程」,通过高度定制化实现明确价值,再逐步拓展至核心工作流。这类工具具备两个共性特征:配置门槛低、能快速产生显性价值。相比之下,需要大量企业定制化的工具,往往在试点阶段就会停滞。

样本中 成功的工具类别 包括:

用于通话摘要和路由的语音 AI

用于合同和表单处理的文档自动化工具

用于重复性开发任务的代码生成工具

失败的工具类别 则多涉及复杂内部逻辑、不透明的决策支持,或基于专有规则的优化——这类工具因「高度依赖企业特定需求」,往往面临用户 adoption(采用)障碍。

部分初创企业通过「主导小而关键的工作流」(尤其是销售和营销领域)实现了突破,随后逐步拓展业务范围。表现顶尖的 GenAI 初创企业,能在成立后 6-12 个月内实现 120 万美元的年化收入。

图表:工具范围与执行难度的关系

4.2.2 与系统集成商建立渠道合作

为克服「信任障碍」,成功的初创企业通常会采用以下策略:与系统集成商建立渠道合作、通过董事会成员或顾问获取采购推荐、借助成熟的企业市场平台进行分类。

图表:企业领导者如何发现 GenAI 解决方案

4.3 企业选择 AI 工具的「窗口期」正在收窄

核心结论: 跨越「GenAI 鸿沟」的窗口期正迅速关闭。 企业正逐步锁定 具备学习能力 的工具,而 智能体 AI (Agentic AI)和记忆框架(如 NANDA、MCP)将决定:哪些供应商能帮助企业跨越鸿沟,哪些则会让企业困在劣势侧。

企业对「能持续适应」的系统需求日益强烈。微软 365 Copilot 和 Dynamics 365 已开始集成「持久记忆」和「反馈循环」功能;OpenAI 推出的 ChatGPT 记忆测试版,也表明通用工具领域的用户预期正朝着同一方向发展。

初创企业若能迅速行动,构建「能从反馈、使用数据和结果中学习的自适应智能体」,就能通过数据积累和深度集成建立持久的产品优势。但这样的窗口期十分短暂——多个垂直领域已启动相关试点。

支持这一转型的基础设施正在逐步成型,例如模型上下文协议(MCP)、智能体间通信协议(A2A)和 NANDA 等框架,这些技术不仅实现了智能体之间的互操作性,还支持它们协同工作。这些协议通过「让专业智能体协作」替代「构建单体系统」,推动了市场竞争和成本优化,也为「智能体网络」(Agentic Web)的发展奠定了基础——这种由互操作智能体和协议构成的网络,将用动态协作层取代传统的单体应用。

未来几个季度,多家企业将锁定供应商合作关系,而这些合作一旦建立,后续更换成本极高。17 位采购和 IT 采购负责人的访谈显示,多数企业认为这一「窗口期」约为 18 个月——这一结论也得到了公开采购数据的支持:企业从发布招标书(RFP)到最终实施的周期,短则 2 个月,长则 18 个月。值得注意的是,企业在「能从自身数据、工作流和反馈中学习的 AI 系统」上的投入,会逐月累积切换成本。

「我们目前正在评估 5 个不同的 GenAI 解决方案,但哪个系统能最好地学习并适应我们特定的业务流程,哪个系统就能最终能赢得合作。一旦我们花费时间训练一个系统来理解我们的工作流程,转换成本就会变得非常高。」——某 500 亿美元金融服务业公司 CIO。

05 成功企业的采购 playbook: 真正的 ROI 在「后台自动化」

核心结论: 成功跨越「GenAI 鸿沟」的企业,在 AI 采购方式上独树一帜:它们不像采购软件即服务(SaaS)产品那样对待 AI ,而是采用类似业务流程外包(BPO)的合作模式。这些企业会要求深度定制化服务、推动一线员工主动采用工具,并以业务指标为依据要求供应商承担责任。最成功的采购方深知,跨越鸿沟的 关键在于建立合作关系,而非简单完成采购交易。

访谈中一个核心发现是:最擅长采购 AI 工具的企业,不会等待「完美用例」出现或寻求总部审批,而是通过分散化试验、供应商合作和明确问责机制推动工具落地。这些采购方不仅态度更积极,在战略调整上也更具灵活性。

在我们的调研样本中,采用「外部合作+具备学习能力的定制化工具」模式的项目,部署成功率约为 67%;而「内部自主开发」模式的成功率仅为 33%。尽管这些数据基于企业自我报告,可能未完全排除干扰因素,但不同模式间的成功率差距在受访者中高度一致。

这一差距也解释了为何 ChatGPT 能在临时任务中占据主导地位,却无法胜任关键工作流,同时也揭示了通用企业级工具为何既比不上消费级 LLMs (LLM),也不敌深度定制化方案。

5.1 合理的组织架构设计是关键

核心结论: 合理的组织架构是跨越「GenAI 鸿沟」的关键。 战略合作伙伴模式的成功率是内部开发模式的两倍 。能否成功,更多取决于「分散决策权+明确责任归属」的架构设计,而非资源投入多少。

阻碍企业跨越「GenAI 鸿沟」的核心障碍并非集成难题或预算限制,而是组织架构设计。数据显示, 企业若能 分散实施决策权、同时保留问责机制 ,成功概率将大幅提升。

我们观察到企业在 AI 实施中主要采用三种团队架构,不同架构的成果差异显著,直接决定了企业处于鸿沟的哪一侧。

表:不同团队架构的 AI 部署情况

研究局限性: 上述百分比基于 52 家受访企业样本,可能无法代表更广泛的市场情况。不同企业对「成功」的定义存在差异,且观察周期可能未涵盖长期实施趋势,无法完全反映长期效果。

重要局限性: 不同实施模式的成功率差异,可能不仅源于模式本身,还与企业自身能力相关。选择外部合作的企业,其风险承受能力、采购成熟度或内部技术实力,可能与选择内部开发的企业存在本质区别。因此,「外部合作与高成功率的相关性」不能直接等同于「外部合作导致高成功率」。

战略合作伙伴模式的成功部署占比显著高于内部开发模式。 尽管样本中「自建」项目数量远多于「采购」项目(许多企业更倾向于尝试内部开发),但成功率数据仍明确偏向外部合作模式。尽管我们缺乏各模式下项目总量的精确数据,但现有模式表明:内部开发项目的成功率远低于外部合作,即便前者的尝试频率更高。

此外,采用战略合作伙伴模式的试点项目,其全面部署概率是内部开发项目的 2 倍。更值得关注的是,员工对外部开发工具的使用率也接近内部工具的 2 倍。

这类合作通常能更快实现价值、降低总成本,并更好地契合业务工作流。企业无需承担「从零开发」的额外成本,同时仍能获得量身定制的解决方案。理解这一模式的企业,能更高效地跨越「GenAI 鸿沟」。

5.2 像选 BPO 一样选 AI

访谈发现,成功跨越「GenAI 鸿沟」的企业存在一个共性模式:顶尖采购方不再将 AI 初创企业视为普通软件供应商,而是当作业务服务提供商,其评估标准更接近咨询公司或业务流程外包(BPO)服务商,而非传统软件厂商。这些企业的具体做法包括:

要求工具根据内部流程和数据进行深度定制

以业务运营成果为基准评估工具,而非依赖模型技术指标

容忍早期试点失败,将部署视为「共同进化」过程,与供应商携手优化

由一线经理发起 AI 项目,而非依赖总部实验室

在最后一点上,基层员工和团队经理往往发挥关键作用。 许多成功的企业级部署,最初都源于 超级用户 (即已尝试用 ChatGPT、Claude 等工具提升个人效率的员工)的推动。这些「产消者」(prosumers)能直观理解 GenAI 的能力边界,进而成为企业内部合规解决方案的早期推动者。

成功的企业不会依赖中心化的 AI 部门发掘用例,而是允许预算负责人和业务领域经理自主发现问题、评估工具并主导推广。这种「自下而上」的发起方式,结合高管层面的问责机制,既能加速工具 adoption(采用),又能确保工具与业务需求匹配。

5.3 真正的成本节约来自替代 BPO 和外部服务

核心结论: 跨越「GenAI 鸿沟」的企业会发现, 运营、财务等被忽视的部门往往能带来最高投资回报( ROI )。 真正的收益并非来自削减内部员工,而是替代业务流程外包(BPO)和外部机构服务。前端工具虽吸引眼球,但后端工具才能实现实质性成本节约。

尽管根据高管的理论估算,50%的 AI 预算流向了销售和营销部门,但我们记录到的最显著成本节约,却来自后台自动化项目。前端工具的成果虽可见且易获得董事会认可,但后台部署往往能更快收回成本,且成本降低效果更明确。

行业领先企业在前后端均实现了可量化的价值提升:

潜在客户资质审核速度:提升 40%

客户留存率:通过 AI 驱动的跟进服务和消息推送,提升 10%

业务流程外包(BPO)替代:客户服务和文档处理领域,每年节省 200 万 -1000 万美元

外部机构支出减少:外部创意和内容成本降低 30%

金融服务风险核查:外包风险管理成本每年减少 100 万美元

值得注意的是,这些收益并非通过大幅裁员实现。工具虽提升了工作效率,但并未改变团队结构或预算规模。相反,投资回报来自「减少外部支出」,包括终止业务流程外包合同、削减机构服务费,以及用 AI 驱动的内部能力替代高价咨询服务。

这一模式表明:尽管销售和营销部门吸引了大部分关注和投资,但对愿意跳出常规用例、真正跨越「GenAI 鸿沟」的企业而言,后台自动化可能带来更显著且可持续的回报。

5.4 就业影响:AI 替代的是「外包职能」,而不是「内部员工」

核心结论:GenAI 已开始对劳动力产生影响,但其表现形式是 选择性替代外包职能 控制招聘规模 ,而非大规模裁员 。跨越「GenAI 鸿沟」的企业,在减少外部成本的同时,内部员工数量仅出现小幅下降。

5.4.1 岗位替代模式与企业战略

我们的分析显示,GenAI 导致的员工减少,主要集中在「传统上被视为非核心业务」的职能领域:客户支持运营、行政处理和标准化开发任务。这些岗位在 AI 应用前就已存在脆弱性——它们常被外包,且流程标准化程度高。尽管高管们不愿透露 AI 导致的裁员规模,但数据显示,在这些企业中,客户支持运营和行政处理岗位的减少比例在 5%-20%之间。

不同行业的招聘预期,与 GenAI 的影响模式存在明显关联:

在 AI 未带来显著结构性变革的行业(医疗健康、能源、先进制造业),多数高管表示未来 5 年「不会减少招聘」。少数高管提到「可能放缓招聘速度」,但也承认「目前缺乏足够系统来准确预测何时、在哪些领域减少招聘」。例如,医疗健康行业高管明确表示「不打算减少医生或临床人员的招聘」。

相反,在 GenAI 已产生可衡量影响的行业(科技、媒体),超过 80%的高管预计未来 24 个月内「将减少招聘规模」。

核心发现:这种「招聘减少」趋势目前仅集中在「AI 先进 adopters(采用者)」中,且仅限当前受 GenAI 显著影响的行业(科技、媒体)。

5.4.2 招聘标准与技能要求的变化

GenAI 的应用,导致企业招聘策略出现分化。尽管高管们对「入门级岗位或通用岗位的招聘规模」尚未达成共识,但所有人都一致强调「AI 素养已成为核心能力要求」。这一趋势反映出企业已意识到:掌握 AI 工具的使用能力,是提升工作流效率的竞争优势。

「我们的招聘策略优先考虑具备 AI 工具使用能力的候选人。在这方面,应届毕业生往往比有经验的专业人士表现更出色。」——某中端市场制造企业运营副总裁

5.4.3 劳动力的变革是一个渐进的过程

麻省理工学院(MIT)「冰山项目」(Project Iceberg)的分析,为「自动化潜在影响」提供了量化参考:

当前自动化潜力: 占美国劳动力价值的 2.27%

潜在自动化影响: 涉及 3900 万个岗位,对应 2.3 万亿美元劳动力价值

随着 AI 系统逐步具备「持久记忆、持续学习和自主工具集成」能力(这些正是跨越「GenAI 鸿沟」的核心特征),上述「潜在影响」将转化为实际行动。

劳动力变革将是一个渐进过程,而非通过一次性岗位替代事件完成。在 AI 系统实现「情境适应」和「自主运行」前,企业的影响将主要体现在「优化外部成本」,而非「内部重组」。

5.5 下一个进化阶段:Agentic Web

核心结论: 单个 AI 智能体的下一个进化阶段,是「智能体网络(Agentic Web)」,自主系统能在整个互联网基础设施中实现「发现、协商与协作」,从根本上改变业务流程的运作方式。

支撑这一变革的基础设施已开始成型,例如模型上下文协议(MCP)、智能体间通信协议(A2A)和 NANDA(网络智能体与去中心化架构)等协议。这些技术不仅实现了智能体之间的互操作性,还支持它们自主浏览网络。

在智能体网络中,系统将能自主完成以下任务:无需人工调研即可发现最优供应商并评估解决方案、无需预构建连接器即可实时建立动态 API 集成、通过区块链支持的智能合约实现无信任交易、跨多个平台和组织边界开发「自优化新兴工作流」。

早期试验已展现出这一模式的潜力:采购智能体可自主识别新供应商并谈判条款、客户服务系统能跨平台无缝协作、内容创作工作流可整合多个服务商资源并实现「自动化质量审核与支付」。这标志着业务流程从「人工介导」向「自主系统主导」的根本性转变——这种转变远超当前的「GenAI 鸿沟」,将重塑企业在网络经济中「发现、集成与交易」的方式。

06 总结:如何解决「GenAI 鸿沟」问题?

成功跨越「GenAI 鸿沟」的企业,在三个方面采取了不同做法:优先采购而非自主开发、授权部门经理而非依赖总部实验室、选择「深度集成且持续适应」的工具而非单纯追求技术指标。最具前瞻性的企业已开始试验「智能体系统」,这类系统能在设定范围内自主学习、记忆并行动。

这一转型不仅是工具层面的变革,更标志着「智能体网络」(Agentic Web)的崛起:一个由具备学习能力的系统构成的、持久且互联的层,能跨供应商、领域和界面协作。如今的企业技术栈以「孤立的 SaaS 工具」和「静态工作流」为特征,而智能体网络将用「动态智能体」取而代之——这些智能体能协商任务、共享上下文并跨企业协调行动。

正如早期互联网彻底改变了内容发布与商业运作模式,智能体网络将重塑「行动执行」的方式——从依赖人工输入的「提示驱动」,转向基于自主协议的「协作驱动」。NANDA、MCP、A2A 等系统代表了这一网络的早期基础设施,它们让企业无需通过代码,而是通过「智能体能力与交互」来构建工作流。随着企业在 2026 年前逐步锁定供应商合作关系并完善反馈循环,跨越「GenAI 鸿沟」的窗口期正迅速收窄。下一轮 AI 采用浪潮的赢家,不会是拥有最炫酷模型的企业,而是能提供「具备学习与记忆能力」或「为特定流程定制」的系统的企业。

「从自主开发转向外部采购」的趋势、「超级用户驱动采用」的兴起,以及「智能体能力的发展」,为能提供「具备学习能力、深度集成」的 AI 系统的供应商创造了前所未有的机遇。那些认识到这些模式并采取行动的企业和供应商,将在「后试点时代」的 AI 经济中占据主导地位,站在「GenAI 鸿沟」的优势侧。

对于目前被困在鸿沟劣势侧的企业,前进路径十分清晰:停止投资「需要持续人工输入的静态工具」,转而与提供定制化系统的供应商合作,并将重点从「炫酷演示」转向「工作流集成」。「GenAI 鸿沟」并非不可逾越,但跨越它需要在技术选择、合作模式和组织架构上做出根本性改变。

来源:时空探险家

相关推荐