MIT|GenAI的鸿沟:2025商业人工智能现状报告

B站影视 日本电影 2025-08-29 15:57 2

摘要:尽管企业在生成式人工智能 (GenAI) 领域的投资已高达300至400亿美元,但本报告揭示了一个惊人的结果:95%的组织回报为零。这一结果在买方(大型企业、中端市场、中小企业)和卖方(创业公司、供应商、咨询公司)中都呈现出截然两分的态势,我们称之为“生成式人

摘要

尽管企业在生成式人工智能 (GenAI) 领域的投资已高达300至400亿美元,但本报告揭示了一个惊人的结果:95%的组织回报为零。这一结果在买方(大型企业、中端市场、中小企业)和卖方(创业公司、供应商、咨询公司)中都呈现出截然两分的态势,我们称之为“生成式人工智能的鸿沟” (The GenAI Divide)。只有5%的集成式人工智能试点项目创造了数百万美元的价值,而绝大多数项目则陷入困境,未能对公司的损益表 (P&L) 产生任何可衡量的影响。这种鸿沟似乎并非由模型质量或监管法规驱动,而是由实施方法决定的。

像ChatGPT和Copilot这样的工具已被广泛采用。超过80%的组织已经探索或试用过它们,近40%的组织报告已进行部署。但这些工具主要提升的是个人生产力,而非企业的盈亏表现。与此同时,那些企业级的、无论是定制开发还是供应商销售的系统,正被悄然弃用。60%的组织评估过此类工具,但只有20%进入了试点阶段,最终仅有5%成功进入生产环境。大多数失败是由于工作流程僵化、缺乏情境学习能力以及与日常运营脱节。

通过对300个公开实施案例的访谈、调研和分析,我们总结出定义“生成式人工智能的鸿沟”的四大模式:

颠覆性有限: 在8个主要行业中,只有2个显示出有意义的结构性变革。企业悖论: 大公司在试点项目数量上领先,但在规模化推广上却相对滞后。投资偏见: 预算倾向于投入那些显性的、与营收直接相关的“前台”职能,而非投资回报率(ROI)更高的“后台”部门。实施优势: 与外部伙伴合作的成功率是内部自建团队的两倍。

阻碍规模化的核心障碍并非基础设施、监管或人才,而是学习能力。大多数生成式人工智能系统无法保留反馈、适应具体情境或随时间推移而改进。

一小部分供应商和买方正通过直面这些局限性来取得更快的进展。成功的买方要求针对特定业务流程进行定制化,并基于业务成果而非软件基准来评估工具。他们期望系统能够与现有流程集成,并能不断优化。满足这些期望的供应商则能在短短数月内获得数百万美元的部署合同。

虽然大多数AI实施项目并未导致裁员,但那些已经跨越了“生成-AI鸿沟”的组织已开始在客户支持、软件工程和行政职能等领域看到选择性的人员影响。此外,表现最佳的组织报告称,通过减少业务流程外包 (BPO) 的支出和对外部代理机构的使用(尤其是在后台运营方面),实现了可观的成本节约。还有一些组织则通过自动化的外联和智能跟进系统,提升了客户保留率和销售转化率。这些早期结果表明,当具备学习能力的系统被应用于特定流程时,即使没有进行重大的组织重构,也能创造出真正的价值。

鸿沟的困境:高采用率与低转型度

核心要点: 大多数组织都落在了“生成式人工智能鸿沟”的错误一边,呈现出高采用率、低转型度的特点。在九个主要行业中,有七个几乎没有显示出结构性变化。企业正在积极试点生成式人工智能工具,但极少数能最终进入实际部署。像ChatGPT这样的通用工具虽被广泛使用,但定制化解决方案却因集成复杂、与现有工作流程不匹配而停滞不前。

当我们审视行业层面的转型模式时,“生成式人工智能的鸿沟”就表现得最为明显。尽管有高调的投资和广泛的试点活动,但只有一小部分组织能够超越实验阶段,实现有意义的业务转型。

1. 鸿沟背后的颠覆现实

核心要点: “生成式人工智能的鸿沟”在行业层面表现得尤为明显。尽管GenAI备受瞩目,但只有两个行业(科技和媒体)显示出清晰的结构性颠覆迹象,而其他七个行业则仍停留在转型的滞后一侧。尽管有高调的投资,行业层面的转型依然有限。生成式人工智能已被嵌入到支持、内容创作和分析等用例中,但很少有行业能展现出与过去通用技术(如新市场领导者的出现、商业模式的颠覆或客户行为的可衡量变化)相关的深层结构性转变。

为了更好地量化颠覆的状况,我们开发了一个综合性的“人工智能市场颠覆指数”。我们根据五项可观察的指标,对每个行业进行0到5分的评分。这些分数是五个维度的标准化平均值,综合了公开指标和访谈评估的结果。我们还测试了不同的权重方案,以确认行业排名的一致性:

头部现有企业之间的市场份额波动性(2022年至2025年)2020年后成立的AI原生公司的收入增长AI驱动的新商业模式的出现可归因于GenAI的用户行为变化因AI工具而引发的高管组织架构变动频率

敏感性分析: 我们对这五项颠覆性指标测试了不同的权重方案。在所有合理的权重方案中,科技以及媒体与电信行业始终保持最高排名,而医疗保健和能源行业则一直处于较低排名。专业服务业对权重变化的敏感性最高,其得分范围在1.2到2.1之间,具体取决于对效率提升的重视程度还是对结构性变革的重视程度。

九个主要行业中有七个显示出显著的试点活动,但几乎没有发生结构性变化。投资与颠覆之间的这种差距,直接大规模地展示了“生成式人工智能的鸿沟”——即广泛的实验并未带来转型。

受访者在评估时非常直白。一位中端市场制造业的首席运营官(COO)总结了这种普遍情绪:

“领英(LinkedIn)上的宣传炒作说一切都变了,但在我们的实际运营中,没有任何根本性的改变。我们处理一些合同的速度是变快了,但仅此而已。”

2.从试点到生产的鸿沟

核心要点: “生成式人工智能的鸿沟”在部署率上表现得最为惨淡,只有5%的定制化企业级AI工具能最终进入生产环境。聊天机器人之所以成功,是因为它们易于试用且灵活;但又因缺乏记忆能力和定制化,而在关键工作流程中失败。这一根本性差距解释了为何大多数组织仍停留在鸿沟的错误一侧。

我们的研究揭示,从对生成式人工智能工具的调研、试点到最终的实际部署,其数量出现了急剧的下降,并且在通用型和定制化解决方案之间存在显著差异。

研究局限性: 这些数据在方向上是准确的,但其依据是个人访谈,而非公司的官方报告。样本量因类别而异,且不同组织对“成功”的定义可能有所不同。

针对特定任务的GenAI工具从试点到生产的急剧下降揭示了“生成式人工智能的鸿沟”

研究注解: 我们将针对特定任务的GenAI工具的“成功实施”定义为:用户或高管认为该工具带来了显著且持续的生产力提升和/或对损益表(P&L)的积极影响。

企业级AI解决方案高达95%的失败率,是“生成式人工智能的鸿沟”最清晰的体现。陷入鸿沟困境的组织持续投资于那些无法适应其工作流程的静态工具,而跨越了鸿沟的组织则专注于具备学习能力的系统。

通用的大语言模型(LLM)聊天机器人似乎展现出很高的试点到实施转化率(约83%)。然而,这掩盖了在价值认知上的深层分歧,并揭示了为何大多数组织仍被困在鸿沟的错误一侧。在访谈中,企业用户普遍对消费级的工具(如ChatGPT和Copilot)给予了积极的反馈。这些系统因其灵活性、熟悉度和即时可用性而受到称赞。然而,同样是这些用户,却对定制化或供应商推销的AI工具抱持压倒性的怀疑态度,他们形容这些工具“僵化”、“过度设计”或“与实际工作流程脱节”。

正如一位首席信息官(CIO)所说:“我们今年看了几十个产品演示。可能只有一两个是真正有用的。其余的要么只是个‘包装壳’,要么就是‘科学实验项目’。”虽然热情和预算通常足以启动试点项目,但要将其转化为能融入工作流程并具有持续价值的系统,却依然是凤毛麟角。这一模式定义了那些处于鸿GH鸿沟困境中组织所经历的常态。

在此被定义为年收入超过1亿美元的公司——大型企业,在试点项目数量上领先,并为AI相关计划分配了更多员工。然而,这种投入强度并未转化为成功。这些组织报告了最低的试点到规模化应用的转化率。相比之下,中端市场公司的行动更快、更果断。表现最佳的公司报告称,从试点到全面实施的平均时间为90天。而相比之下,大型企业则需要九个月或更长时间。

3.影子人工智能经济:跨越鸿沟的桥梁

核心要点: 尽管官方的企业级项目仍停留在“生成式人工智能鸿沟”的困境中,但员工们早已通过个人AI工具跨越了这一鸿沟。这种“影子AI”所带来的投资回报率(ROI)往往优于正式项目,并揭示了弥合鸿沟的真正有效方法。

在令人失望的企业部署数据背后,隐藏着一个惊人的现实:人工智能其实已经在改变工作方式,只是并非通过官方渠道。我们的研究发现了一个蓬勃发展的“影子AI经济”——员工们使用个人的ChatGPT账户、Claude订阅服务以及其他消费级工具,将他们工作中的很大部分自动化,而这通常未经IT部门知晓或批准。

其规模之大令人瞩目。虽然只有40%的公司表示他们购买了官方的大语言模型(LLM)订阅服务,但在我们调查的公司中,超过90%的员工报告称他们会为工作任务而常规性地使用个人AI工具。事实上,几乎每一个人都在工作中的某些方面使用了大语言模型。

影子AI经济——员工使用率远超官方采用率

在许多案例中,“影子AI”用户报告称,他们通过个人工具,在每周的工作中每天都会多次使用大语言模型,而他们公司的官方AI项目却仍停滞在试点阶段。

这种“影子经济”表明,当个体能够接触到灵活、响应迅速的工具时,他们是能够成功跨越“生成式人工智能鸿沟”的。那些能够认识到这一模式并在此基础上发展的组织,将代表企业AI应用的未来方向。一些有远见的组织正开始着手弥合这一差距,他们的方法是:在采购企业级替代方案之前,先从员工的“影子”使用中学习,并分析哪些个人工具真正创造了价值。

4.投资模式体现鸿沟

核心要点: 投资分配揭示了“生成式人工智能鸿沟”在实践中的体现——50%的GenAI预算流向了销售和营销,但后台办公自动化的投资回报率(ROI)往往更高。这种偏见反映的是指标归因的难易度,而非实际价值,并导致组织持续将重点放在错误的优先事项上。

从职能重点来看,对GenAI工具的投资是高度集中的。由于各组织尚未对GenAI的支出进行正式量化,我们请高管们将一笔假设的100美元预算分配给不同职能部门。在我们的调查中,销售和营销职能部门获得了各组织约70%的AI预算分配。

GenAI投资按职能分布

研究注解: 尽管GenAI投资的总体职能分配(例如,约50%投向销售与营销)在高管访谈中相对一致,但其子类别和用例的细分最多只能被视为方向性的参考。子类别的划分反映的是综合记录和坊间传闻的模式,而非精确的会计核算。公司类型导致了显著的差异。例如,制造商和医疗保健提供商通常在销售与营销上的投入极少,而在运营方面则投入更多。科技和媒体公司通常优先考虑市场营销、内容创作和开发者生产力。专业服务业则倾向于文件自动化和法律/合规工具。

销售和营销之所以占据主导地位,不仅因为它们显而易见,还因为其成果易于衡量。诸如产品演示数量或邮件响应时间等指标,可以直接与董事会级别的关键绩效指标(KPI)挂钩。

相比之下,法律、采购和财务等职能部门所能提供的效率提升则更为微妙。这包括减少合规违规、简化工作流程或加快月底结算流程——这些都非常重要,但很难在高管会议或投资者报告中直观地展示出来。

一家财富1000强医药公司的采购副总裁清楚地表达了这一挑战:“如果我买一个工具来帮助我的团队更快地工作,我该如何量化这种影响?当它不能直接提升收入或降低可衡量的成本时,我该如何向我的CEO证明其合理性?我可以辩称它能帮助我们的科学家更快地获得他们需要的工具,但这与最终的利润影响已经隔了好几层关系了。”

这种投资偏见将资源导向那些显眼但通常转型价值较低的用例,从而使“生成式人工智能的鸿沟”永久化,而后台职能中那些投资回报率最高的机遇却依然资金不足。

除了衡量方面的挑战,信任和“社会认同”(social proof)在采购决策中仍然起着决定性作用。一家大型快速消费品(CPG)公司的一位采购主管道出了许多买方面临的困境:“我每天都会收到无数邮件,都声称能提供最好的GenAI解决方案。有些演示看起来很厉害,但建立信任才是真正的挑战。当我们的收件箱被如此多的选择淹没时,我们很大程度上依赖于同行的推荐和我们人脉圈内的引荐。”这凸显了一个更普遍的模式:单靠产品质量本身,很少能足以促成交易。相比于功能或特性集,引荐、过往的合作关系以及风险投资(VC)的介绍,仍然是企业是否会采用某项技术的更有力预测指标。

为什么试点项目停滞不前:鸿沟背后的学习差距

让企业组织停留在GenAI鸿沟错误一边的主要因素是学习差距,即工具不会学习、集成度差或与工作流程不匹配。用户更喜欢使用ChatGPT来完成简单任务,但由于其缺乏记忆能力,在处理关键任务时会放弃使用。所缺失的是能够适应、记忆和演进的系统,这些能力正是鸿沟两边的区别所在。

1.困住组织的障碍

核心要点: 主要障碍反映了定义GenAI鸿沟的根本性学习差距:用户抵制那些无法适应的工具,模型质量在没有上下文的情况下会下降,而当系统无法记忆时,用户体验也会受到影响。即便是ChatGPT的忠实用户,也对那些不符合他们期望的内部GenAI工具表示不信任。

为了解为何如此少的GenAI试点项目能超越实验阶段,我们调查了来自52个组织的执行发起人和一线用户。参与者被要求在一个1到10分的频率量表上对常见的规模化障碍进行评分,其中10分代表最常遇到的障碍。

结果揭示了一个可预见的领先障碍:抵制采用新工具。然而,第二高的障碍比预期的要重要得多

GenAI试点项目失败的原因:企业规模化AI面临的主要障碍

研究说明: 这些分数反映的是报告的发生频率,而非对障碍影响的客观衡量,并且可能因行业和组织规模的不同而有显著差异。

模型质量问题的重要性最初似乎有悖常理。ChatGPT及类似工具的消费者采用率已大幅飙升,超过40%的知识工作者个人在使用AI工具。然而,同样是这些将AI工具融入个人工作流程的用户,在企业系统中遇到这些工具时却认为它们不可靠。这种矛盾在用户层面揭示了GenAI鸿沟。

这种偏好揭示了一个根本性的矛盾。同样是每天使用ChatGPT处理个人任务的专业人士,却要求企业级工具具备学习和记忆能力。大量员工已在私下使用AI工具并报告生产力提升,而他们公司的正式AI项目却停滞不前。这种“影子”使用形成了一个反馈循环:员工知道好的AI是什么样的,这使得他们对静态的企业工具容忍度更低。

2. 为什么通用工具时赢时输

核心要点: GenAI鸿沟体现在用户偏好上:ChatGPT之所以能胜过企业工具,是因为它更好、更快、更熟悉,即便两者使用相似的模型。但这种偏好也揭示了为什么组织仍然停留在鸿沟的错误一边。

我们的后续访谈揭示了一个惊人的矛盾。那些对企业AI工具持怀疑态度的专业人士,往往是消费者大语言模型界面的重度用户。当被要求比较他们的体验时,出现了三个一致的主题。

用户偏好驱动因素:通用大语言模型界面 vs. 集成工具

一家中型公司的公司律师的例子很好地说明了这种动态。她的公司投资了5万美元购买一个专门的合同分析工具,但她仍然习惯性地使用ChatGPT来起草文件:“我们购买的AI工具提供的是僵硬的摘要,定制选项有限。而使用ChatGPT,我可以引导对话并不断迭代,直到获得我想要的确切内容。根本性的质量差异是显而易见的,ChatGPT总能产生更好的输出,尽管我们的供应商声称他们使用的是相同的底层技术。”

这种模式表明,一个每月20美元的通用工具,在即时可用性和用户满意度方面,其表现往往优于成本高出几个数量级的定制企业系统。这个悖论恰好说明了为什么大多数组织仍然停留在GenAI鸿沟的错误一边。

3.定义鸿沟的学习差距

核心要点: ChatGPT的局限性恰恰揭示了GenAI鸿沟背后的核心问题:它会忘记上下文,不会学习,也无法演进。对于关键任务,90%的用户更倾向于选择人类。这个差距是结构性的,GenAI缺乏记忆和适应能力。

鉴于用户对消费者大语言模型界面的偏好,我们调查了是什么阻碍了其在关键任务中的更广泛应用。这里的障碍与一般可用性问题截然不同,并直接揭示了定义GenAI鸿沟的学习差距。

核心工作流程集成的障碍

那位倾向于使用ChatGPT起草初稿的律师,在处理敏感合同时划清了界限:“它非常适合头脑风暴和起草初稿,但它记不住客户的偏好,也不会从之前的编辑中学习。它会重复犯同样的错误,并且每次都需要大量的上下文输入。对于高风险的工作,我需要一个能够积累知识并随时间进步的系统。”

这些反馈指出了根本性的学习差距,正是这个差距让组织停留在GenAI鸿沟的错误一边。用户欣赏消费者大语言模型界面的灵活性和响应性,但他们需要当前工具无法提供的持久性和情境感知能力。当我们要求企业用户为高风险工作评估不同选项时,偏好层级变得清晰起来。

对高风险工作的适用性感知

结果显示,对于简单的工作,AI已经赢得了胜利,70%的人更喜欢用AI起草邮件,65%的人用它进行基础分析。但对于任何复杂或长期的工作,人类以9比1的优势占据主导地位。这里的界线不是智能,而是记忆、适应性和学习能力——这些正是区分GenAI鸿沟两边的确切特征。

智能体AI(Agentic AI)是一类在设计上就嵌入了持久性记忆和迭代式学习的系统,它直接解决了造成GenAI鸿沟的学习差距问题。与当前每次都需要提供完整上下文的系统不同,智能体系统能够保持持久性记忆、从互动中学习,并能自主地协调复杂的工作流程。企业早期的相关实验——例如能够端到端处理完整查询的客服智能体、监控和批准常规交易的财务处理智能体,以及跨渠道追踪客户互动情况的销售流程智能体——都展示了自主性和记忆能力是如何解决企业所指出的这些核心差距的。

跨越GenAI鸿沟:顶尖构建者如何成功

位于GenAI鸿沟正确一侧的组织都有一个共同点:他们构建的是能够从反馈中学习的、自适应的嵌入式系统。跨越鸿沟的顶尖初创公司专注于狭窄但高价值的用例,深度融入工作流程,并通过持续学习而非宽泛的功能集来实现规模化。领域知识的流畅度和工作流程的集成度比华丽的用户体验更重要。

在我们的访谈中,我们观察到GenAI初创公司之间出现了日益扩大的分歧。一些公司还在沿用过时的SaaS(软件即服务)模式,因而被困在鸿沟的错误一侧;而另一些公司则通过积极的定制化和对齐真实的业务痛点,成功吸引了企业的注意。

市场对GenAI工具的需求依然旺盛。有几家初创公司报告称,他们在几天内就签订了试点协议,并很快达到了七位数的年化收入。脱颖而出的并非那些构建通用工具的公司,而是那些将自身嵌入工作流程、适应具体情境,并从狭窄但高价值的立足点进行扩展的公司。

我们的数据显示了一个清晰的模式:成功的组织和供应商都在积极解决学习、记忆和工作流程适应性的问题,而那些失败的公司要么在构建通用工具,要么试图在内部开发这些能力。

成功的初创公司构建的系统能够从反馈中学习(66%的高管希望如此)、保留上下文(63%的高管有此需求),并针对特定工作流程进行深度定制。他们从工作流程的边缘环节入手,进行大量定制,然后扩展到核心流程中。

1.企业真正想要什么:跨越鸿沟的桥梁

最成功的供应商明白,要跨越GenAI鸿沟,需要构建的系统是高管们反复强调的那种:不仅能生成内容,还能在其环境中学习和改进的AI系统。

在评估AI工具时,买家们一致强调了一组特定的优先事项。我们对这些访谈中的主题进行了编码,以量化它们在采购决策中出现的频率:

对劳动力影响的担忧远没有预期的那么普遍。大多数用户对自动化表示欢迎,尤其是对那些繁琐、重复性的任务,只要数据安全且结果可衡量。尽管传统观念认为企业抵制训练AI系统,但在我们的访谈中,大多数团队表示愿意这样做,前提是好处明确且有安全保障。尽管对AI兴趣浓厚,但市场对新兴供应商,尤其是在高信任度或受监管的工作流程中的供应商,存在着明显的怀疑态度。许多采购负责人告诉我们,他们会忽略大多数初创公司的推销,无论其创新性如何。一位全球消费品公司的采购主管表示:“我们每天都会收到几十个关于AI驱动的采购工具的推销。然而,我们现有的业务流程外包(BPO)合作伙伴已经了解我们的政策和流程。我们更可能等待他们推出AI增强版的服务,而不是转向一个未知的供应商。”

2.跨越鸿沟的制胜 playbook

核心要点: 成功跨越GenAI鸿沟的初创公司会先在狭窄的工作流程中取得小而明显的胜利,然后进行扩展。设置负担轻、价值实现快的工具,其表现优于重度的企业级构建。渠道推荐和同行信任是弥合鸿沟的关键增长杠杆。

最成功的初创公司通过执行两个策略,既满足了市场对学习系统的渴望,又解决了对新工具的疑虑。

2.1针对特定工作流程进行定制

关键在于将系统嵌入到非核心或相邻的流程中,通过显著的定制化展示清晰的价值,然后再扩展到核心工作流程。成功的工具都有两个共同特点:配置负担低和价值即时可见。相比之下,那些需要大量企业定制的工具往往在试点阶段就停滞不前。我们样本中的成功类别包括:

用于通话摘要和路由的语音AI用于合同和表格的文档自动化用于重复性工程任务的代码生成

举步维艰的类别通常涉及复杂的内部逻辑、不透明的决策支持,或基于专有启发式算法的优化。这些工具由于企业内部的深度特殊性,常常在采用上遇到阻力。

一些初创公司通过主导小型但关键的工作流程(尤其是在销售和市场营销领域)然后进行扩展而表现出色。排名前四分之一的GenAI初创公司在推出后的6到12个月内,年化收入就达到了120万美元。

2.2 利用推荐网络

为了克服信任壁垒,成功的初创公司通常会利用与系统集成商的渠道合作、来自董事会成员或顾问的采购推荐,以及通过熟悉的企业市场进行分销。

3.跨越鸿沟的窗口正在缩小

核心要点: 跨越GenAI鸿沟的窗口正在迅速关闭。企业正在锁定具备学习能力的工具。像NANDA和MCP这样的智能体AI和记忆框架,将决定哪些供应商能帮助组织跨越鸿沟,而哪些供应商将被困在错误的一侧。企业越来越需要能够随时间适应的系统。微软的365 Copilot和Dynamics 365正在整合持久性记忆和反馈循环。OpenAI的ChatGPT记忆功能测试版也预示着通用工具领域类似的期望。

能够通过构建自适应智能体(agent)来快速弥合这一差距的初创公司,可以通过数据和集成深度建立持久的产品护城河,这些智能体能从反馈、使用情况和结果中学习。实现这一目标的时间窗口很窄。在许多垂直领域,试点项目已经在进行中。

支持这一转变的基础设施正在通过像模型上下文协议(Model Context Protocol, MCP)、智能体到智能体协议(Agent-to-Agent, A2A)和NANDA这样的框架涌现,它们实现了智能体的互操作性和协调。这些协议不仅允许专门的智能体协同工作,从而避免了对单一庞大系统的需求,还创造了市场竞争和成本效益。这些框架构成了新兴的“智能体网络(Agentic Web)”的基础——这是一个由可互操作的智能体和协议组成的网状结构,它将取代单一应用,实现动态的协调层。

在未来几个季度,几家企业将锁定供应商关系,而这种关系将几乎无法解除。这个18个月的时间窗口是我们采访的17位采购和IT采购负责人达成的共识,并得到了对公共采购披露信息的分析支持,该分析显示企业的“从需求到实施”周期从两个月到十八个月不等。投资于能从数据、工作流程和反馈中学习的AI系统的组织,正在创造每月都会复合增长的转换成本。

一位价值50亿美元的金融服务公司的首席信息官表示:“我们目前正在评估五种不同的GenAI解决方案,但最终能最好地学习和适应我们特定流程的系统将赢得我们的业务。一旦我们投入时间去训练一个系统来理解我们的工作流程,转换成本将变得非常高昂。”

跨越GenAI鸿沟:顶尖买家如何成功

成功跨越GenAI鸿沟的组织在采购AI方面采取了不同的方法:他们更像是业务流程外包(BPO)的客户,而非软件即服务(SaaS)的客户。他们要求深度定制,从一线推动应用,并要求供应商对业务指标负责。最成功的买家明白,跨越鸿沟需要的是合作关系,而不仅仅是购买。

在我们的访谈中,一个见解变得清晰起来:最高效的AI采购组织不再等待完美的用例或中央审批。相反,他们通过分布式实验、供应商合作和明确的问责制来推动应用。这些买家不仅仅是更积极,他们在战略上也更具适应性。

在我们的样本中,与具备学习能力的定制化工具进行外部合作的项目,部署成功率约为67%,而内部自建工具的成功率约为33%。虽然这些数字反映的是自我报告的结果,可能没有考虑所有混杂变量,但其差异的幅度在所有受访者中都是一致的。

这一差距解释了为什么ChatGPT在临时任务中占主导地位,但在关键工作流程中却表现不佳,以及为什么通用企业工具既输给了消费者级的大语言模型,也输给了深度定制的替代方案。

1.跨越鸿沟的组织设计

核心要点: 正确的组织结构对于跨越GenAI鸿沟至关重要。战略合作的成功率是内部自建的两倍。成功更多地取决于下放权力并明确所有权,而不是资源。

跨越GenAI鸿沟的主要障碍不是集成或预算,而是组织设计。我们的数据显示,当公司下放实施权限但保留问责制时,他们会取得成功。我们观察到三种主要的GenAI实施团队结构,它们的结果截然不同,反映了组织处于鸿沟的哪一侧。

研究局限性: 这些百分比反映了我们对52个组织的访谈样本,可能不代表更广泛的市场模式。成功定义因组织而异,且观察期可能无法捕捉到长期的实施趋势。

重要局限性: 这些成功率的差异可能反映的是组织能力,而不仅仅是实施方法。选择外部合作的组织可能在风险承受能力、采购成熟度或内部技术能力方面与选择内部自建的组织有所不同。相关性并不一定证明因果关系。

战略合作实现的成功部署比例显著高于内部开发。虽然在我们的样本中,我们观察到的“自建”项目远多于“购买”项目,许多组织都在探索内部开发,但成功率更偏向于外部合作。尽管我们缺乏关于项目总量的精确数据,但这一模式表明,内部开发项目的成功率要低得多,尽管尝试得更普遍。

虽然组织常常结合多种方法,但通过战略合作构建的试点项目达到全面部署的可能性是内部构建的两倍。更引人注目的是,外部构建工具的员工使用率几乎是内部构建工具的两倍。这些合作关系通常能提供更快的价值实现时间、更低的总成本,以及与运营工作流程更好的对齐。公司避免了从零开始构建的开销,同时仍然能获得量身定制的解决方案。理解这一模式的组织能够更有效地将自己定位在GenAI鸿沟的正确一侧。

2. 跨越鸿沟的买家实践

在访谈中,成功跨越GenAI鸿沟的组织中出现了一个一致的模式:顶尖的买家对待AI初创公司,更像是对待业务服务提供商,而不是软件供应商,他们用更接近于咨询公司或业务流程外包(BPO)的标准来要求他们。这些组织:

要求与内部流程和数据对齐的深度定制。基于运营结果而非模型基准来评估工具。在早期失败中合作,将部署视为共同演进的过程。从一线经理而非中央实验室获取AI项目动议。

在最后这种模式中,个人贡献者和团队经理通常扮演着关键角色。许多最强大的企业部署始于“超级用户”,这些员工已经为提高个人生产力而试用过像ChatGPT或Claude这样的工具。这些“产消者”(prosumers)直观地理解了GenAI的能力和局限性,并成为内部认可解决方案的早期拥护者。成功的组织不再依赖集中的AI部门来识别用例,而是允许预算持有者和领域经理提出问题、审查工具并领导推广。这种自下而上的采购方式,再结合高管的问责制,既加速了采纳,又保证了运营上的契合度。

3.真正的投资回报率(ROI)在哪里:跨越鸿沟之后

核心要点: 跨越GenAI鸿沟的组织发现,投资回报率(ROI)最高的领域往往在被忽视的职能部门,如运营和财务。真正的收益来自替代业务流程外包(BPO)和外部机构,而不是削减内部员工。前台工具引人注目,但后台工具能带来实实在在的节省。

尽管50%的AI预算流向了销售和市场营销(根据与高管的理论估算),但我们记录到的一些最显著的成本节约来自后台自动化。虽然前台的收益显而易见且对董事会友好,但后台的部署通常能带来更快的投资回报期和更清晰的成本削减。顶尖的组织正在这两个领域都创造出可衡量的价值。

前台收益:

销售线索资格认证速度:提升40%。客户保留率:通过AI驱动的跟进和消息传递提升10%。

后台收益:

BPO替代:每年在客户服务和文档处理方面节省200万至1000万美元。代理机构支出减少:外部创意和内容成本降低30%。金融服务风险检查:每年在外包风险管理上节省100万美元。

值得注意的是,这些收益的实现并未伴随实质性的裁员。工具加速了工作,但并未改变团队结构或预算。相反,ROI来自于减少外部支出、终止BPO合同、削减代理费用,以及用AI驱动的内部能力替代昂贵的顾问。

这一模式表明,尽管销售和市场营销吸引了大部分的注意力和投资,但后台自动化可能为那些愿意超越显而易见用例并真正跨越GenAI鸿沟的组织提供更显著和可持续的回报。

4.工作影响的现实:跨越鸿沟的真正含义

核心要点: GenAI已经开始对劳动力产生影响,其表现形式是选择性地替代之前外包的职能和限制招聘模式,而不是大规模裁员。跨越了GenAI鸿沟的组织在显著降低外部成本的同时,内部员工人数略有减少。

4.1替代模式与组织战略

我们的分析显示,由GenAI驱动的裁员集中在那些历史上被视为非核心业务活动的职能上:客户支持运营、行政处理和标准化的开发任务。这些角色在AI实施之前就因其外包状态和流程标准化而显示出脆弱性。高管们不愿透露因AI而裁员的范围,但据估计,这些公司裁减了5%到20%的客户支持运营和行政处理工作岗位。

特定行业的招聘预期与GenAI的影响模式呈现出明确的相关性。在受AI结构性颠覆影响最小的行业,如医疗保健、能源、先进工业,大多数高管表示,在未来五年内没有当前或预期的招聘削减计划。少数高管提到他们可能预期招聘会减少,但承认目前没有系统来准确预测这将在何时何地发生。例如,医疗保健行业的高管表示,他们预计不会减少医生或临床人员的招聘。

相反,在技术和媒体这两个GenAI已显示出可衡量影响的行业,超过80%的高管预计在24个月内招聘数量将减少。在当前正经历GenAI显著颠覆的行业(技术和媒体)中。

4.2 不断演变的招聘标准和技能要求

GenAI的采用正在各组织间催生出不同的招聘策略。尽管高管们在入门级或总招聘数量上未达成共识,但他们一致强调,AI素养是一项基础能力要求。这反映了组织认识到,精通AI代表了在工作流程优化方面的竞争优势。“我们的招聘策略优先考虑那些展现出AI工具熟练度的候选人。应届毕业生在这项能力上常常超越经验丰富的专业人士。”——某中端市场制造业公司运营副总裁

4.3 未来劳动力影响预测

麻省理工学院的“冰山项目”(Project Iceberg)分析为潜在的自动化风险提供了量化背景:

当前自动化潜力: 占美国劳动力价值的2.27%潜在自动化风险: 影响3900万个岗位,涉及2.3万亿美元的劳动力价值

随着AI系统发展出持久性记忆、持续学习和自主工具集成等能力——这些正是跨越GenAI鸿沟的决定性能力——这种潜在的风险将变为现实。

劳动力的转型将是渐进发生的,而非通过离散的替代事件。在AI系统实现情境自适应和自主运行之前,其对组织的影响将主要通过优化外部成本而非内部重组来体现。

5. 超越智能体:智能体网络(THE AGENTIC WEB)

核心要点: 个体AI智能体的下一阶段演进是智能体网络(agentic web),在这个网络中,自主系统能够跨越整个互联网基础设施进行发现、协商和协调,从而从根本上改变业务流程的运作方式。

支撑这一变革的基础设施已经通过模型上下文协议(MCP)、智能体到智能体协议(A2A)和NANDA等协议开始浮现,它们不仅实现了智能体的互操作性,还支持了自主的网络导航。在一个智能体网络中,系统将无需人类研究即可自主发现最佳供应商并评估解决方案,无需预置连接器即可实时建立动态的API集成,通过启用区块链的智能合约执行去信任交易,并发展出能够跨多个平台和组织边界自我优化的涌现式工作流程。早期实验显示,采购智能体能独立识别新供应商并进行条款谈判,客服系统能跨平台无缝协调,内容创作工作流能整合多个提供商并实现自动化的质量保证与支付。这代表了一种根本性的转变,从当今由人类主导的业务流程,转向在整个互联网生态系统中运行的自主系统,这将远超当前的GenAI鸿沟,重塑组织在网络化经济中发现、集成和交易的方式。

总结

成功跨越GenAI鸿沟的组织在三个方面做法不同:他们选择购买而非自建,赋能一线管理者而非中心化的实验室,并选择能够深度集成且随时间自适应的工具。最具前瞻性的组织已经在试用能够在特定参数范围内学习、记忆和自主行动的智能体系统(agentic systems)。

这一转变不仅标志着工具层面的变革,更预示着一个“智能体网络”(Agentic Web)的崛起:一个持久的、互联的学习系统层,能够跨越不同供应商、领域和接口进行协作。当今的企业技术栈由孤立的SaaS工具和静态工作流程所定义,而智能体网络则将取而代之,它由能够协商任务、共享上下文并在整个企业范围内协调行动的动态智能体构成。

正如最初的万维网(Web)去中心化了信息发布与商业活动,智能体网络也去中心化了“行动”,从简单的指令提示(prompts)转向由协议驱动的自主协调。像NANDA、MCP和A2A这样的系统代表了这个网络的早期基础设施,使组织能够不通过代码,而是通过智能体的能力和互动来构建工作流程。随着企业在2026年前开始锁定供应商关系和反馈循环,跨越GenAI鸿沟的窗口正在迅速收窄。下一波应用浪潮的赢家,将不是那些模型最华丽的,而是那些能够学习和记忆的系统,和/或那些为特定流程定制构建的系统。

从“自建”到“购买”的转变,结合“产消者”(prosumer)应用的兴起和智能体能力的出现,为那些能够提供具备学习能力、深度集成的AI系统的供应商创造了前所未有的机遇。能够识别并顺应这些模式的组织和供应商,将在后试点时代的AI经济中,在GenAI鸿沟的正确一侧,确立其主导地位。

对于目前被困在鸿沟错误一侧的组织来说,前进的道路是明确的:停止投资于需要不断提示的静态工具,开始与提供定制化系统的供应商合作,并将焦点从华丽的演示转移到工作流程的集成上。GenAI鸿沟并非永久性的,但要跨越它,需要在技术、合作关系和组织设计上做出根本性的不同选择。

来源:AI观察室

相关推荐