企业级 AI Agent 能出现杀手级应用吗?

B站影视 内地电影 2025-04-03 11:44 1

摘要:在崔牛会策划的“DeepTalk|DeepSeek 猜想系列”对话中,勤策创始人兼CEO 刘昭担任主持人,与悦点科技创始人兼CEO 任鑫琦和标普云创始人兼总裁杨蜀对“DeepSeek 是企业软件的‘救命稻草’吗?”这一话题做了深入探讨。

文|牛透社;整理|燕子

DeepSeek 开源,让 AI 更普及,面对革命性的技术升级,对企业软件行业来说,DeepSeek 会是“救命稻草”吗?

图片由 AI 生成

在崔牛会策划的“DeepTalk|DeepSeek 猜想系列”对话中,勤策创始人兼CEO 刘昭担任主持人,与悦点科技创始人兼CEO 任鑫琦和标普云创始人兼总裁杨蜀对“DeepSeek 是企业软件的‘救命稻草’吗?”这一话题做了深入探讨。

在任鑫琦看来,AI 应用的关键在于精准度和落地可行性。虽然 AI 技术在推理和语言生成上取得了突破,但企业级应用的核心挑战在于如何确保高精准度。企业对 AI 的要求不仅是能生成答案,而是必须比人工更准确、更可靠,才能真正落地。此外,现阶段大模型仍然依赖于基础技术的进步,DeepSeek 的未来取决于能否在企业环境中建立技术壁垒,而不是单纯依赖大模型的能力提升。

杨蜀认为,通用智能体市场难做,行业深度结合才是出路。企业级 AI 的核心价值不在于“通用”,而在于如何深入行业,将 AI 嵌入具体的生产流程和业务环节。企业真正需要的是定制化、具备行业 Know-how 的智能体,而不是一个通用的、容易被大模型进化所淘汰的方案。AI 的未来不是拼谁的技术参数更强,而是谁能更好地理解企业业务并提供深度赋能。

更多关于产品创新、企业杀手级应用等话题,讨论见真章。

勤策,基于SaaS的消费品行业CRM。目前,在 AI 上实现了AI 年度订阅费数千万。
悦点科技,通过企业级知识图谱与大模型技术相结合,实现新一代数据智能系统。目前,企业智能体及应用收入已达数千万。
标普云,聚焦金融和制造行业提供行业大模型和智能体。目前,AI 相关产品订单破千万。

以下为对话内容,经牛透社编辑整理:(有删减)

Manus 是产品的重大创新?

刘昭:你认为 Manus 算不算一个产品的重大创新?创新性毋庸置疑,但能否称得上"重大创新"?

任鑫琦:这取决于如何定义"重大"。在我看来,作为首款敢于如此自信推出的 AI 产品,它确实称得上重大创新。今天谷歌也发布了两款工具集,同样是在解构智能体开发,将行业标准推向更高层次。但在那之前,Manus 能够将整个产品逻辑组织得如此完善,已经非常出色。我们都很敬佩这种能充分利用现有技术打造优质产品的能力。

刘昭:杨蜀,你们公司也在做智能体,为什么没有优先开发类似 Manus 这样的产品?

杨蜀:Manus 做的是通用智能体。凡是涉及“通用”概念的领域——无论是通用大模型、通用智能体,还是通用人形机器人,长期来看前景广阔,但对创业者而言,短期内都是极具挑战的三座大山。我们非常赞赏这些探索者,就像当初的"六小龙"专注通用大模型一样。虽然需要有人开拓通用领域,但我们选择深耕垂直行业。

刘昭:作为创业者确实存在这种顾虑。选择通用路线难免会担忧未来与大厂正面竞争,因此多数人不敢轻易尝试。Manus 敢于挑战通用领域,这种勇气本身就值得赞赏。Manus 团队(肖弘他们)下一步该怎么走?

任鑫琦:Manus 团队之前做了一款面向海外市场的浏览器插件 Monica 已经证明了他们对 ToC 市场的敏锐度,能快速整合 OpenAI 的能力,并在产品组合和用户心理把握上很有一套。这一波他们赚足了眼球和流量,这是推广 ToC 产品的强大基础。

刘昭:但流量变现了吗?没有邀请码,想参与都难。

任鑫琦:流量确实有了,知名度也上去了。后续的流量转化应该不是问题,他们团队组织成熟,可能是在等待合适的时机。比如最近他们宣布和阿里通义千问合作,可能是在寻求更强的算力支持,从而实现更大的目标。

在 ToC 领域,他们敢于在现有技术基础上推进 AI Agent 的发展。我一直认为,AI 行业是“水涨船高”——基座模型是“水”,我们是“船”,关键是如何不被淹没,而是顺势而上。

刘昭:杨蜀,你怎么看?Manus 的技术路线是通过复杂的智能体交互,但可能核心只是一个智能体+浏览器/应用模式。未来,会不会有新技术直接颠覆它?甚至大模型自身进化后,这种模式就被淘汰了?而且听说它处理一个问题的 token 成本高达 5 美元,你觉得这种模式有未来吗?

杨蜀:我接着鑫琦的观点说。智能体的智能程度是有评价标准的,比如 GIA(通用智能评估)。Manus 的评分很高,接近 DeepSeek 的水平,尽管它用的是 Claude 底座。本质上,智能体的能力取决于大模型的智能程度。

目前大模型的路线仍然是 LLM(大语言模型)+ RL(强化学习),但从 GPT-4 的表现来看,这条路线可能快接近极限了。因此,智能体的上限取决于它的技术框架(任务规划、执行、工具调用、反思能力等),而它的基线能力则由大模型决定。

所以,Manus 能走多远,首先取决于大模型还能进步多少。如果大模型的智能提升放缓,智能体的发展也会受限。但至少在现阶段,Manus 在复杂任务处理上的表现还是可圈可点的。

刘昭:鑫琦,你们在企业级应用上已经用过类似 Manus 的技术了?是在他们之前还是之后?

任鑫琦:肯定是在他们之前。不过这不代表我们更创新,因为企业级应用场景完全不同。我们做人财物、产供销或 OA 系统时,面对的都是固定软件。我们可以用很多“作弊”方法——比如符号主义的方式限定问题域,再让大模型执行。这和开放域的难度不同,但我们的核心挑战是要保证绝对准确性。当模拟某个岗位角色时,AI 的执行准确度必须高于人类才能落地。

刘昭:所以你们不会完全跟随 Manus 的路线?

任鑫琦:不会。我认为 Manus 未来的关键在于如何基于基座模型构建竞争壁垒,这关系到它的生死存亡。

刘昭:通用智能体的技术门槛有多高?Manus 想建立壁垒不容易吧?这种情况下,它的产品价值和公司前景如何?

杨蜀:前景要问他们的投资人(腾讯刚追投)。但 Manus 的重大意义在于证明了通用智能体的可行性,相当于做了次全民科普。企业现在都该开发自己的“数字员工”,针对具体场景解决问题。

刘昭:肖弘团队从微伴、Monica 到 Manus,确实很厉害。为什么他们选 Claude 而不用 DeepSeek?鑫琦你们在企业市场主要用什么模型?

任鑫琦:Claude 的代码生成能力确实强(特别是3.5/3.7版本),但国内企业客户很少需要实时代码生成。我们更多用开源模型,比如通义千问 72 B 到 110 B 版本推理能力显著提升后,配合知识蒸馏效果很好。只有在工具链不足时,才需要 Claude 这种实时代码生成能力。

刘昭:所以固定问题可以预写代码,动态问题才需要 Claude?

任鑫琦:基本正确。现在写代码也会用 Claude,只是提前写好嵌入系统,不实时生成。Manus 集成了 26 个工具,当现有工具不够时才需要代码生成补足。

刘昭:杨蜀怎么看 Claude?

杨蜀:在硅谷,Claude 是四大模型之一(
OpenAI/Claude/Facebook/Grok)。业内说 Claude 是“理科生模型”,OpenAI 是"文科生模型"。Manus 用 Claude 很合理,毕竟主打海外市场。

AI 时代,为何不见企业杀手级应用

刘昭:在移动互联网时代有支付宝、微信这类杀手级应用;4G 时代有抖音这类短视频应用。但在 AI 时代,企业侧还没有出现杀手级应用,为什么?大家有没有遇到一些特别有前景的客户应用案例?

任鑫琦:这个问题可以从两个维度来看:

第一,时间因素。AI 技术商业化落地的时间还比较短,真正的杀手级应用可能还在孕育中。

第二,生态成熟度。以 DeepSeek 为例,虽然它在思维推理、语言生成等核心能力上已经出圈,但相比国外成熟的模型生态,还存在明显差距。比如它的开源版本目前还不支持 function calling 等功能,这说明整个工具链和生态支持还需要进一步完善。

刘昭:有人提了一个观点很有意思,说企业级应用对容错率要求高,不允许 AI 胡言乱语,而个人应用相对宽容。这是否是企业级难出杀手级应用的原因?

任鑫琦:这确实是个重要因素。这也解释了为什么我们的技术栈与互联网大厂不同——我们不需要解决通用问题,而是要打造一个高精准度的专业知识库。

初期使用 AI 时,人们会对它处理陌生领域的能力赞叹,但当涉及自己专业领域时,就会发现它只能达到平均水平。而企业级应用恰恰是要服务专业人士,要求 AI 比专家做得更好,这本身就是巨大挑战。

目前我认为 Agent 的杀手级应用主要有两类辅助方向:

1. 静态辅助(被动):如知识库查询,用户有需求时提供帮助。

2. 动态辅助(主动):Agent 嵌入业务系统,在日常工作中主动提供支持。

而未来的突破点在于实现特定场景的全闭环 Agent 应用。不是说完全替代某个岗位,而是能承担该岗位的全部工作。比如:

外呼系统(已经做得很成熟)顾问级销售/客服医疗领域的专业建档和慢病跟踪工业制造领域的维修建议

关键评估标准是实际的人力替代效能。被动辅助难以量化价值,但若能明确替代多少人力完成闭环工作,这才是 AI 商业化的重要指标。

杨蜀:关键在于 AI 能否进入企业的核心生产流程。通用智能体(如客服、办公助手等)确实有需求,但真正的价值在于与行业深度结合的特色模型。这可能是大模型、小模型,或是特定算法,关键是要融入企业的核心生产系统。

我们正在与制造业上市公司合作优化其核心生产流程算法。这里有个重要认知:一是必须尊重行业壁垒,隔行如隔山,跨行业经验往往难以复用;二是行业知识存在“关键1%”现象,企业间 90% 的基础知识可能相同,但决定竞争力的往往是那 1% 的核心 know-how。

以半导体为例:台积电与中芯国际的工艺知识库 99% 可能相同,但量产 3nm 与 7nm 的关键差距就在那 1%。

这才是 AI 最能创造价值的地方,它将智能技术与企业的核心生产流程深度融合。

刘昭 :今天我特别想重点讨论一个问题:目前使用大模型优化生产流程到底有没有真正成功的案例?虽然大家都在谈论这个方向,但我好像还没看到特别突出的成功案例,不知道各位怎么看这个问题?

任鑫琦:我补充一下实际情况。目前国内确实很少有企业能在这方面做得特别好,我们团队一直深度参与包括 ERP 供应链在内的智能体开发,深知其中的难度。

不过美国已经出现了成功案例,比如 Palantir 这家公司。2023 年之前他们主要做情报分析,后来推出了 AIP 平台,深度整合到企业 ERP 系统中。要知道 ERP 不是单一软件,而是产、供、销的复杂组合体系,光是像 SAP 这样能把软件应用流程组织好就已经很不容易了,但其中涉及的数据联通分析、预测调度优化等环节,确实还需要大量数据分析和 AI 技术的支持。

经过两年实践,Palantir 确实取得了一些成功案例。为什么他们能成功?我认为关键在于发展阶段的问题。目前中国的 AI 发展水平相当于美国 2023 年 GPT-3.5 到 4.0 的爆发期。说实话,2023-2024 年我和很多做 ERP 实施的企业老板交流时发现,他们对 AI 的了解还很有限。这次 DeepSeek 的突破确实是个标志性事件,让我们在技术上基本追平了美国,但确实是刚刚追平。

一体机是企业的必选项?

刘昭:关于现在流行的一体机,你们怎么看?杨蜀,听说你在海外也推广过一体机,美国市场是否存在大模型一体机的需求?

杨蜀:我们主要在亚太区推广。去年推广效果不太理想,但今年明显好转。主要有两个原因:第一,去年 OpenAI 在大模型领域遥遥领先,虽然我们推广的是基于开源的自研大模型,但国外客户普遍认为中国 AI 与 OpenAI 存在差距。第二,在 DeepSeek 出现之前,大模型对算力需求很高,导致一体机价格昂贵。在海外市场,我们无法推广公有云方案,只能推一体机。

今年情况发生了变化:首先,DeepSeek 的表现让市场认可中国大模型已经接近 OpenAI 的水平;其次,DeepSeek 团队在 GPU 优化方面做得非常出色,他们从芯片级进行开发,大幅提升了算力效率。我甚至觉得他们应该考虑做 GPU 研发。这些技术进步降低了一体机的配置要求,性价比显著提升,所以今年市场反响明显好转。

刘昭:为什么一体机主要在中国市场比较火爆?

杨蜀:中国市场对一体机的接受度确实很高,连公有云巨头都开始布局一体机业务,这个现象很有意思。本质上反映了两个核心需求:第一是企业希望在本地部署推理算力,这源于对核心知识库安全性的考虑;第二是数据隐私保护的需求。正是这两个因素推动了一体机市场的发展,公有云厂商也看到了这个趋势。

实际上美国市场的一体机需求也在增长,主要原因:一是美国公有云服务成本过高,企业自建私有云更具经济性;二是在 AI 时代,企业更关注核心知识产权的保护。比如 OpenAI 虽然承诺保护用户数据,但生成内容的版权归其所有。这就引发了数据安全方面的担忧,也是 DeepSeek 被传可能面临诉讼的原因之一。这种对知识泄露的担忧,进一步推动了对本地化部署的需求。

一体机未来一定是必选项。

刘昭:鑫琦,你怎么看?为什么你们选择做企业私有模型呢?

任鑫琦:这个问题要从我们在 2023 年的判断说起。根据多年 To B 服务经验,我们发现真正具备实力和意愿尝试 AI 的,主要还是中大型企业,包括国央企和大型上市民企。这些企业的思路与美国很不同,他们更倾向于私有云部署,甚至要求完全私有化。基于这个市场特点,我们决定专注这个方向。

当时我们还考虑到几个现实因素:

1. 经济环境影响:疫情后企业IT预算收紧,不可能像过去十年信息化建设时期那样大规模投入;

2. 硬件限制:不仅面临美国的芯片禁运,即使没有限制,短期内大量采购高端显卡也不现实;

3. 成本考量:只有具备建设智算中心能力的企业才可能承担私有化大模型的高成本。

因此在实际落地时,我们选择基于开源模型的私有化部署方案。虽然初始能力有限,但我们通过其他技术手段进行补充和完善。随着技术发展,今年我们看到了很大的希望。

或许在一年内会出现能够实现全闭环的智能体应用,真正替代特定业务场景中的人工工作。这种应用将会快速普及。

来源:牛透社

相关推荐