摘要:在最近的云栖大会上,虽然各类AI Agent百花齐放,但真正能够实现商业闭环、形成用户粘性的场景依然屈指可数。如果你仍在PPT上写着“让AI替代80%员工”,那么我建议你把这篇文章转发给你的老板,或许能为你保住一份工作。
在最近的云栖大会上,虽然各类AI Agent百花齐放,但真正能够实现商业闭环、形成用户粘性的场景依然屈指可数。如果你仍在PPT上写着“让AI替代80%员工”,那么我建议你把这篇文章转发给你的老板,或许能为你保住一份工作。
01 一个“真香”现场
在谈论AI Agent之前,我想先分享一下我自己的背景,以免遭到质疑。数字的确很漂亮,但今晚我只想强调:这些技术每一个都在刀口上,随时可能面临崩溃的风险。
02 第一刀:95%可靠=36%崩溃
我们首先要了解一个重要公式:0.95²≈36%。对于许多朋友来说,这可能听起来有些复杂,但我来简单翻译一下:如果你的单步准确率达到了95%,这已经超过了许多人类实习生的水平。然而,若要进行20步的链式操作(比如编写代码、运行测试、提交、合并、部署等),成功率将骤降至36%。客户通常要求99.9%的成功率,这意味着每一步都必须达到99.995%的准确性。目前,最先进的GPT-5在函数调用评测中的准确率也仅有96.7%。因此,凡是在官网上写“完全自主多步workflow”的产品,都可以被视为不切实际的幻想。
03 第二刀:Token成本是平方级
许多人可能没有意识到,为什么对话式AI无法大规模应用。我们来看看Token的成本:第1轮对话需要1k tokens,而到第50轮时,成本就变成了50×50=2.5k tokens。经过真实测试,100轮对话的单条成本高达52美元,若服务1000名用户,则一天的开销将达到5万美元,甚至高于人力成本。由此可见,凡是需要长记忆和长对话的Agent,都难以逃过首席财务官(CFO)的审查。
04 第三刀:工具反馈墙
虽然Agent调用API的成功率为98%,但理解返回结果的成功率却只有67%。原因在于真实世界的接口往往复杂而混乱。为了提升数据库Agent的成功率,我花了三周时间为每个工具编写“AI友好摘要”,最终才将成功率从67%提高到91%。实际上,70%的工作量并不在模型本身,而是在为工具进行“人话翻译”。
05 数据集成坟场
许多企业在数据集成时面临重重困难:甲方的ERP系统没有API,只有Excel导出;OAuth登录频繁改动,Agent常常因401错误而无法访问。财务系统要求“摘要≤20字”,但Agent生成的摘要却常常超出限制。人们常说“只要接API”,这实际上是最无用的鸡汤。真实的数据集成过程往往需要70%的胶水代码、25%的重试补偿以及仅5%的AI。
06 何以生存?
那么,什么样的Agent才有可能存活下来呢?我总结了五大生存原则,符合这些原则的Agent才能活到2026年。
解决真实痛点原则:应用场景必须务实,真正解决用户或企业的实际痛点,避免成为“展示时很酷,但热闹过后无法发挥作用”的产品。清晰的价值主张原则:定义清晰的能力边界并传递给用户,让用户确切知道能用它来做什么,建立稳定的使用预期。极致场景深耕原则:优先选择巨头看不上的垂直细分小场景,做“小而精”的深度定制,以接地气的解决方案构筑生存壁垒。生态依附与借力原则:积极“抱大腿”,嵌入成熟的平台生态(如微信、支付宝),利用其流量和支付接口,实现最省心的商业闭环。可靠的用户体验原则:在特定边界内确保产品稳定可靠,实现“360度无死角可用”,这是让用户从尝试走向依赖的关键。07 给产品经理的三句忠告
首先,别再写“支持100步流程”,而是要明确“第1步失败后该如何处理”。其次,把Token单价直接写进产品需求文档(PRD),不要让CFO替你填写。最后,每个Agent都必须配备“一键甩锅”按钮,让人能在1秒内接管。
08 结语
我并不是在唱衰AI Agent,而是在揭示目前行业内存在的种种误区。AI本身没有问题,问题在于我们用错误的经济模型、错误的心理预期和错误的产品定义,去构建一座空中楼阁。真正能够盈利的Agent,往往更像是工具而非人类;而成功的公司则会将AI技术隐藏在后台,为客户提供更高的确定性。
来源:正正杂说