摘要:这背后需要实践者具备四种超强的能力:即对模型的边界预估,对复杂系统的理解力、对产品工程的实践力,以及对商业场景的洞察力。
文|Pippobei
出品|AI闹
01行业如今的关键是「谁能造出一个真正有用的Agent?」
讨论的焦点问题变成「Agent的认知边界」:有多大的自主性?需要多强的上下文理解?又如何在现实任务中保持稳定?
这背后需要实践者具备四种超强的能力:即对模型的边界预估,对复杂系统的理解力、对产品工程的实践力,以及对商业场景的洞察力。
在 Sheet0.com 的创始人王文锋看来:Agent本质上是一种「利用模型知识,结合实时信息,使用工具解决问题」的产品形态。
他提出的关键问题是:为什么模型本身已经达到博士水平,但很多Agent 的表现仍停留在实习生阶段?
这中间的 GAP关键在于在「实时信息」和「工具设计」层并没有很好的适配模型能力。
Sheet0.com 就是他对Agent 的认知落地:一款在 AI 时代为模型提供可扩展的实时数据获取能力的产品。今年8月中旬,产品上线, 主要面向数据分析师、产品经理、工程师、市场营销人员等在数据收集处理上花超过5个小时的用户。
一个典型的用户场景:一位销售在寻找潜在 AI 行业客户,过去,他要先通过LinkedIn、X等社媒,收集公司信息,再分析该公司是否为 AI 行业公司,还需要寻找目标联系人联系方式等等。而搭建这样一个程序,需要一个工程师4-8周的时间。而Sheet0只需要30分钟内就可以给用户交付完整的数据表格。
王文锋认为,产品核心解决的问题是让无论是个人、企业还是 Agent 这个新个体,都可以随心所欲的获取数据,解决问题。
「在经济学里面有个概念叫价格弹性,是一个衡量价格/成本发生变化时,需求会如何变化的指标。数据领域往往价格弹性远大于1,这意味着10倍的成本下降,带来的不是需求的10 倍增加,而是几十倍甚至上百倍」
王文锋在 SpaceX 的星舰基地
尽管 Sheet0 在数据获取环节已经帮用户做到10倍提效,但王文锋并没有将「省时间」作为产品的核心价值,他认为「准+快」才是Sheet0的长期核心价值。即:
1、 必须保证给用户交付的数据100%准确。
2、在单位时间内,尽可能提高数据的交付量。
构建人与 Agent 之间的信任,是一个长期的命题。「这背后是作为工程师也要信任模型。」
Sheet0 所有的系统行为都被分解成可以追踪、可复用的「语义步骤」,Agent 必须理解自己在做什么,并在出错时可以进行自我修复。这是王文锋的设计哲学,「在 Agent 干活之前,先让他变聪明。」
而让 Agent 变得可解释,是 Agent 下一步发展的关键环节。
作为连续创业者,王文锋自 2017年毕业后,先是写了四年代码,期间曾负责地平线 AI 数据平台。 2021 年和朋友合伙创业,作为CTO研发了新一代的Serverles 消息队列,在Data Infra、AI领域积累了近十年的开发经验。2023年加入 AI 浪潮,开始了自己的第二次创业和 CEO 之旅。
AI 闹见到王文锋时,他刚从美国回来,时差还没有完全倒明白,sheet0现在主攻美国市场,一半的团队在美国, 10 月将全量上线。
我们的话题围绕在 sheet0上线两个月后,他对 Agent 的最新思考。实时数据的获取只是第一步,他接下来计划为大模型造更多的工具,他认为让模型自主学会使用工具,是Agent未来的竞争关键:「每造出一个新工具,相当于为模型解锁了一个新技能。」
可解释:先变聪明再变强
AI闹: beta版本8月上线后,用户是否接受这款产品?反馈如何?
王文锋:从注册用户、付费数据,比我预期要好不少。
现在 80%的用户来自于发达国家,第一是美国,第二是日本,其中 60% 的用户每周在数据工作方面消耗时长超过 5 个小时。
日本是超出我预期的一个市场,好像是有一个日本博主把我们在美国做推广的帖子搬运后,来了很多日本流量。后来我调研发现日本用户的付费意愿更强,是因为他们的数字化基础比美国落后不少,使用Excel等传统数据工具的用户更多。
不过现在的主要目标是先把美国市场做好,美国市场起来后打其他市场可以事半功倍。
AI闹:中国市场呢?
王文锋:我第一次创业也是做软件,我的经验是,美国竞争很激烈,但都有钱赚。因为能赚到钱,所以大家对做事情更有信心一些。国内软件的商业化土壤一言难尽。
AI闹:进入真实的用户场景后,现阶段 Agent 需优化的最棘手的问题?
王文锋:如何构建一个合理的反馈闭环,这是非常细致的一个工程,比我想象的难度要大。
解决这个问题给我启发最大的是 Cloud Code ,它让我意识到——Agent 要真正聪明,关键不在于「能做多少事」,而在于它能不能「知道自己在干什么」。
Cloud Code 系统完全是事件驱动的,每一个动作、每一次变化,它都会自动记录成一条带语义的信息。
比如说,它会在工作过程中发出一种叫 reminder 的内部消息,用来提醒自己注意某个细节,但这条消息用户是看不到的。换句话说,它不仅知道「怎么做」,还知道「为什么要这么做」。
AI闹:「带语义的信息」具体指什么?
王文锋:举个例子,你让 Agent 去整理一张网页上的表格。它可能要花四五步才能完成:打开网页、识别内容、发现错误、修改数据。但对模型来说,四五步太冗余了。
能不能把这些过程压缩成一句有意义的总结,比如「因为发现数值错误,系统自动调整了这一列」。这样一来,Agent就不再是机械执行,而是能带着理解去行动。
它的每一步都有清晰的定义,可以被记录、被复用、被优化。
现在,我们架构上基本已经调整成类 Cloud Code 的形式。希望 Agent 不只是执行指令,而是能像一个真正的「人」,理解自己为什么要这么做。只有这样,它才能不断进化。
AI闹:Sheet0没上线之前,你在一次行业分享中曾说过Context engineering 是 Agent 成败的关键,这个思考现在有变化吗?
王文锋:没有,反而会觉得更重要了。Agent 想变得更聪明,关键是 Context 要够多、够细。包括用户的使用记录、任务执行过程中的反馈、失败案例等等。
只有积累到一定程度,Agent 才能真正学会在不同场景下该怎么做。
AI闹:你认为具体需要多少才算积累到位?
王文锋:没有标准答案。因为 context 的类型太多样了。
我们现在有一个做法:当用户任务执行失败,比如某个网页数据没采集下来,我们会记录下失败案例,然后再去找类似任务里那些成功的案例,对比两者的差异。成功的路径,我们提炼出来、结构化保存,放进内部知识库。下次再有类似任务,系统就能直接调用这些经验,成功率会更高。
你可以把它理解成,我们在给 Agent 建记忆——每一次出错、修复、成功,都会变成它下次做得更好的基础。
AI闹:听起来有点像是给模型建立bad case库?
王文锋:可以这么理解。当积累到足够多的经验后,这些数据就能直接拿去微调模型。原来它靠外部经验,慢慢就会变成模型自己的知识。也就是说,Agent 在一次次失败和修复的过程中,逐渐学会了避免犯同样的错误。
AI闹:这个过程现在能自动化吗?行业有些做法会训练一个小模型去check?
王文锋:目前还没办法完全自动化,我们是半自动的流程。人还是要参与做一些轻量级的标注或分类。
大家都在讲「端到端」,希望模型从头到尾自己搞定一切,但现实情况是没到那一步。
我觉得我们并没有脱离有多少人工,就有多少智能的阶段,LLM只是放大了人类工作到 Agent 智能之间的杠杆;另外还有个关键是我们需要知道什么时候可以离开人工。
AI闹:很多人质疑sheet0更像是一个传统的表格工具或者爬虫工具?
王文锋:我知道外界会有这样的印象。原因也挺简单的——因为 Sheet0 现在从能力上来说确实只有一个基础能力:从网页收集数据。
Sheet0 的目标是「在AI时代提供可扩展的实时数据获取能力」。
因为Agent的目标是 take actions,所以需要做决策,而做决策一方面需要依赖模型知识,另一方面还要依赖实时数据。比如「明天穿什么衣服」这个问题,模型就至少需要知道明天天气、去哪里找实时数据才能作出决策,光有知识还不行。
为了实现目标,Sheet0 采取的方案是 bottom-up 重新为模型构建出一整套的「数据工作环境」,构建这个环境的第一步,是可以将「任意的数据源变为动态的结构化表格」,而我们最先选择的数据源就是网页,因为它受众广,商业化价值也够高,让我们可以在 day 1就开始赚钱。
所以现在大家说我们像「表格」或「爬虫」工具,有点像我们养狗,在狗子成年前都会有一段尴尬期。而 Sheet0 就在这样的尴尬期。我相信6个月以后大家再来看Sheet0,就不会这样说了。我们会有更创新的产品形态交付给大家。
AI闹:现在,你怎么看模型的能力边界和 Sheet0 的分工?
王文锋:其实我更想说模型和 Agent 的区别。
Agent 本质上利用模型知识,结合实时信息,使用工具解决问题的程序。今天我们看到基座模型在多个领域已经达到或接近博士水平;但是在实际的产品表现上面,还停留在实习生。
这里面的核心是实时信息和恰当工具的缺失。
我们讲「工欲善其事必先利」,所以 Sheet0 核心是在围绕数据场景设计一系列的「趁手工具」,并不会过多的去考虑模型的边界,因为我们相信在长期来看,模型是没有能力边界的。
对于模型厂商而言,如果一个工具的复杂性过高,就意味着它们一定不会去做,因为复杂的工具意味着需要 own一个复杂的 infra。
AI闹:基于上面的认知,你认为有哪些有巨大商业潜力的方向等待开发?
王文锋:比如最近我们的用户想做一件事情,需要找 1 , 000 个英国K12 的家长。传统办法是找当地的社区网站、或脸书的一些用户群组。
但换个角度想,什么样的人完成这个任务最简单,肯定是本身就在英国读书的孩子,假如他们有自己的 Agent,跟他的 Agent 联系一下,让他们收集 20 个家长联系方式,酬劳 100 块钱,肯定有人愿意(假设不考虑合规问题)。
现阶段这些数据是离线的,但却是最有价值的,如何更方便的获取这些数据也是我们的主线目标之一。这是让我最兴奋的部分,肯定会想出办法解决。
未来,我希望 sheet0 可以为用户收集整理所有数据,私有的,公开的和个性化的,并以结构化的方式交付。之所以强调结构化,是因为结构化数据天然是带有语义的,而且可以进一步通过类似 SQL 的工具让模型实时创造工具。
AI闹:你觉得2025下半年到2026年,Agent 行业还有什么新机会?
王文锋:具体我说不上,但是我可以分享一个概念:价格弹性。
这是一个经济学上的概念,用于衡量当解决的问题的成本下降的时候,需求增加或减少的程度。当价格弹性为1的时候,意味着成本下降10倍,需求也会增长10倍。我的建议是可以思考哪些领域的问题是价格弹性大于1的,这些问题都非常值得用 Agent 的方式去解决。
AI闹:现在模型不可避免存在幻觉,以及Agent还严重缺乏Context的情况下,你为什么格外强调自己100%的准确率?
王文锋:我的理念是做 Agent 首先要让用户信任,信任很重要,背后也是工程师要信任大模型。
模型的「幻觉」由它的底层原理决定的,它的本质上是在「总结信息」——比如说我给它两百个网页,它会自己判断筛选出其中的一百个,然后再去总结内容。但压缩总结这件事是有风险的,它可能会理解错、归纳错,「幻觉」就是这么来的。
但是我们抓数据的逻辑更接近「复制粘贴」,你可以理解成,sheet0 就像一个认真抄笔记的人——网页上是什么,它就一模一样抓下来放进表格,比如说网页上是一张公司信息表,我们抓下来的数据在表格里也是一模一样。
在技术上,我们底层全是动态生成的代码,所以才敢说给用户交付的数据是100%准确的。
AI闹:初期阶段就追求100%准确会不会导致进度慢?
王文锋:短期内确实会慢,因为我们做了很多Infar层面的努力,但我觉得长期来看,这是「慢就是快」。我们尽量避免做消耗动能的事情,而是长期积累势能。
就像我前面提到了,我认为构建Trust是人和AI之间的终极命题,我们需要在Day 1就坚持去做这件事情。
很多人不看好我们,我非常理解,因为相信,所以看见,我不能这么去要求别人。我过去的失败经验告诉我,选择坚持什么非常重要,这个是创始人的品味。
AI闹:现在你中美两地跑,这一年美国的AI创业环境给你什么启发?
王文锋:我和很多美国的创始人交流,发现他们和中国创业者最大的区别是,他们敢于勇敢创新,敢于bet(下注)。而中国的创业者,今天一上来就会被问「你的用户是谁、他们为什么用你、怎么保持用户粘性、竞品是什么、大厂干了后怎么办」,这其实是很让人难过的事情,因为过早的关注这些问题会扼杀真正的创新。
Lovable 火了以后,人们才发现用的最多是产品经理和销售,而不是程序员;同样在 Manus 诞生之后,人们才发现原来一个人真的可以一周看100个研报。
AI产品应该从人性角度出发,在恰当的节点「打造出符合大家对未来想象的产品」。I know it when I see it。
王文锋和他的柯基小狗叫「鸡腿」
前景背包是王文锋,他日常热爱徒步,图在美国某国家公园
AI闹:创业2年,前两个都没推进下去,有没有心理上的至暗时刻?
王文锋:有的。2024 年 10 月份 - 12月底接近3个月的时间,真的是一片灰暗。那时第一个项目黄了,第二个项目决定不做了,新方向还没定,完全丧失了信心。加上我妈妈那会身体非常不好,应该是有点抑郁。
当时有非常想躺平的感觉,创什么业,为什么这么辛苦这么累;在3月份处理完我妈妈的后事之后,我又回到了北京,开始触底反弹。Sheet0 就是在这种状态下一点一点探索出来的。
加上回过头去看,当时做的第1个产品和第2个产品其实方向都很正确,但是就是因为太在意短期目标,中间没能推进下来。
之前有朋友问我,觉得做 CEO 最关键的能力是什么?我的回答是对痛苦的长期耐受力。而之所以能够忍受痛苦,一定是有一个更强的信念在支撑。所以我想告诉很多创业者,一定要相信自己!
图片来源|受访人供图、Unsplash
—彩蛋一枚—
我们有播客了
本期和王文锋的完整采访已同步更新,
解锁更多完整内容。
来源:ainow!
