摘要:近日,美国红点创投合伙人Jacob Effron在其播客Unsupervised Learning中与Felicis合伙人、ChatGPT前产品负责人Peter Deng进行了一次对谈,二人围绕SaaS和AI产品的定价与价值衡量机制差异、语音AI的潜力以及AI
近日,美国红点创投合伙人Jacob Effron在其播客Unsupervised Learning中与Felicis合伙人、ChatGPT前产品负责人Peter Deng进行了一次对谈,二人围绕SaaS和AI产品的定价与价值衡量机制差异、语音AI的潜力以及AI产品经理与组织等话题进行了深入讨论。
Felicis官网显示,Peter Deng出身于产品领域,最近一份工作是在OpenAI担任副总裁,领导 ChatGPT 产品团队。此前他曾任 Airtable 的首席产品官,并在Meta工作十年,参与构建核心Facebook产品、创建Messenger团队、打造并领导Instagram的产品团队。他毕业于斯坦福大学,获Symbolic Systems学士学位,并在硕士阶段聚焦人机交互。
在访谈中,Peter Deng认为,AI 与传统 SaaS 的差异在“价值单位”迁移:从“账号/使用权”转向“完成的有效工作产出”,如果定价纯按人头或纯按token(定价),都可能是“失真”的,更可能出现的模式是平台基础费+与价值感知相关、可理解的弹性计价。
在此次讨论中,二人分析语音表达优势是输出与思维几乎同步,这降低了“空白对话框“带来的摩擦,而且,语音表达能够有更多“情绪纹理”,能增强协作沉浸。他还认为,语音可能有望成为下一代“超级入口”形态(比如通过耳机和主动式语音交互)。在这样的入口下,UI界面权重下降,企业更多比拼 “是否被用户或用户的Agent选用”,而这则取决于企业提供的真实价值。
谈及目前智能体的进展,Peter Deng认为,“智能体”这个词现在被严重透支,“今天的大多数所谓智能体其实还不是(真正的智能)。它们最多也就多想几步,还没有具备真正行动所需的全链条工具”,正因为此,他认为智能体目前被高估了,而AI评测(Evals)则因为不够“性感”而被远远低估,“但它是真正塑造模型行为的关键杠杆。
对于未来智能体的入口,Peter Deng认为,不会只有一个大企业垄断的智能体入口,人需要多样化入口的,而其差异化会落在进入语境、心智框架、使用期望上,“产品的微妙之处都在这。”
以下为「明亮公司」编译的访谈正文(有删节):
左为Jacob Effron,右为Peter Deng(来源:Unsupervised Learning视频账号)
Jacob:Peter Deng先后在Uber、Facebook、OpenAI负责产品,现在在Felicis做投资。我是Jacob Effron,在本期Unsupervised Learning里,我们聊了很多有意思的话题,最有意思的是,凭借他横跨这些角色的经历,能讨论AI里很多核心问题——OpenAI的未来、ChatGPT未来怎么跟像Uber这样的应用协作、AI如何改变产品管理、AI产品定价的新难题与新模型、Meta未来的AI战略等等。和一个视角这么立体的人即兴碰撞这些话题,特别享受。欢迎Peter。
Peter:谢谢邀请。
AI产品和SaaS的核心区别:价值衡量与定价逻辑
Jacob:你做过这么多重量级的产品领导岗位——Uber、Facebook、OpenAI,现在大家都在讨论:新一代AI公司到底长什么样?SaaS时代哪些经验仍然适用,哪些必须重新思考?
Peter:我觉得变化最大的是“价值衡量与定价逻辑”,尤其订阅模式会经历一场大演化。举个具体例子,我刚去OpenAI时,负责消费产品、产品营销和设计。第一个扎进去的项目就是ChatGPT Enterprise。我想实实在在做点有用的事,还记得写了第一版规格/愿景文档,团队很快就启动了。大概7周就上线,说实话挺疯狂。临近发布时我得了新冠,在地下室隔离期间远程开会讨论定价。
也许是新冠导致的脑雾,我当时有个非常强烈的直觉:按“人头”定价哪里不对。经常出现“有时低估,有时高估”的情况。因为传统SaaS的“工作单位”是获得使用工具的权利;但在AI场景,真实的价值单元更接近“完成的工作量/产出”。当然,你可以把人头价定得特别高,覆盖那些GPU重度用户。但我真正想要的是:更贴近有实际产出的工作。AI时代,好用、愉悦仍然重要,但我更想看到创业公司转向一个核心问题,什么才是有价值的工作产出,围绕它怎么设计定价?我没有现成答案。我也不认为“单纯按使用量”是解法,因为token数不等于价值。它只是某种粗略的工作量,不代表真正的"价值捕获"。这块会和传统SaaS拉开很大差异,还会持续演化。
Jacob:这一点很有意思。大家嘴上都说成果导向定价,现实里真正落地的也就客服等少数领域,数人头还是主流。你看到过哪些让你眼前一亮的定价方式?
Peter:有些初创公司做的是平台费+价值感知式使用费的组合。他们会“从创造的价值反推公式”。大致思路:提升了多少人的效率?影响多大?反推一个“基础平台费”+“弹性部分”。我觉得这种方式解决了大部分问题。买家心理上对“纯成果付费"始终会排斥,因为激励也可能扭曲。但平台费+可理解的使用变量,是个更易接受的折中。到年末回头算账——"确实划得来"。自然就说得通了。
Jacob:如果把这套放进ChatGPT Enterprise,会怎么做?
Peter:我觉得我们当时做不了——因为用例太广。我自己不是“日活”用户,更像是“小时活”用户。因为它有太多用途:看投资备忘录、让表达更紧凑、研究、快速补脑、当思维搭档……它始终陪着我。比如开车用语音模式,下班回家,我就像在进行一档私人播客,跟它深挖我正在研究的一个主题。使用面太宽,导致很难统一按工作产出来衡量。但很多垂直初创公司的应用面会更聚焦,就容易多了。
Jacob:你还提到按token定价不理想,这很合理,和终端价值不成正比。你想让用户尽可能多体验模型力量,但一些用户会跑出巨额账单。产品上你们如何兼顾?
Peter:我们在ChatGPT产品里大量处理限额问题。确实存在鲸鱼用户在高峰时段疯狂消耗资源。要点是,让80%-90%的人感受不到(查询次数)存在上限(因为他们永远不会撞线)。当接近或触发限额时,体验要设计得“不指责、不打击、不制造羞耻感”,而是柔性提示:你可以解锁下一层。这正是“账户数模式”的优点:用户心智是几乎随便用,因为大概率用不完。等使用超出主档,再自然引导升级。对这样一个通用型产品,按人头+适时升级,是在体验感与"资源公平"之间的平衡。
Jacob:对,尤其在企业里,广泛的平台费+少量超级重度用户。管理员还得判断哪个层级最合适。
Peter:我会强烈建议:不要"完全按底层使用量(如GPU秒/token)定价。一旦你把"价值单位"滑向"资源用量",本质上就进入"同质化比价+底线竞赛"。
Jacob:对,现在常见模式就是一个平台费+某种封顶……另一个我想问的:这一波最好的AI产品,往往来自研究/后训练团队与产品/工程非常紧密的搭档。你在OpenAI见过成熟形态,最佳协作模型是什么样?
Peter:我从“产品人”起步,一直坚信PM的本质是“填补空白”(补上跨学科之间的空白),是服务调度角色。在不同公司,协作构型不同。比如在Facebook/Instagram,是“PM+设计+工程”三角,各自拉不同目标函数,互相挑战。Uber则是“PM+工程+设计+运营(Ops)”,因为涉及物理世界,我很喜欢那次“从纯数字→数字+物理”的跨度。到了OpenAI/新AI产品时代,构型再进化:变成“PM+设计+工程+后训练负责人”。因为在很大程度上,模型本身就是产品。PM的工作也转型,新的"规格文档"其实是"评测集合"。你在定义"行为边界"、"成功准则",光写文字不够,得把这些边界固化成可执行评测。于是PM的核心输出之一变成“设计、维护、迭代评测套件”。这四个角色合成一个共生小单元。每一波技术迭代都这样:构型换了,底层逻辑没变——PM拾起所有没人拿的碎片。
Jacob:所以评测是这一波的新基石,帮后训练团队更好支撑用例。过去几年我们经历的是泛化能力台阶式跃迁——模型升级,所有任务提升。现在进入专门化、场景级后训练时代。就算GPT-5出来,它也许在代码更好,但未必在每家公司所有任务上都更优,更多反馈—定制"循环会发生在应用层。
Peter:完全同意。模型在“行为塑形”上的进步,比如强化学习、工具调用,已经把抽象层再往上抬了一层,给创业者搭建平台。另一个关键点是,有大量数据不在开放网页,模型没见过。把这些私域数据+独特洞察嵌进去,现在模型的"可塑性"已经够高,这是创业黄金时刻。
Jacob:看创业者时,“AI原生”背景有多重要?我能想象一个光谱——一端懂市场、会go-to-market、自己做评测、拿一点专有数据+调OpenAI微调就够。另一端自己训练/重度后训练。
Peter:我觉得(AI原生)很重要。在OpenAI时我的类比是:我们发现了元素周期表里的全新元素。真正懂它的人,是那些亲手反复把玩、深度实践这种新材料的人。他们知道它的延展性、属性、极限。那时候我们不断"意外"解锁模型里隐藏的能力。回答你的问题:创始团队里必须有人真正深入玩过这个新元素。没玩过的一聊就露馅:想象力浅、路径陈词滥调。不好玩。不必是研究员,但最好的构建者一定深懂“底层原材料”,你能从他们身上看到深度实践的痕迹。
Jacob:我特别喜欢这一波的地方是,模型放出去后,连公司自己都会被用户发掘的用法震惊。
Peter:是啊。我常说:我们仍在发掘潜能的过程中。这就是为什么此刻创业好,你可以把模型放进具体语境里,追问“给它这类邮件/这些数据/这种结构化上下文,它能走多远?”我们一边发掘能力,一边底座本身还在进步。任何一个线程都够炸裂,更别说并行推进。
Jacob:对。……基础模型公司做产品,是否有天然优势?
Peter:肯定有优势,也有劣势。优势是:你坐在发明新方法的人旁边,更快知道"某种行为"可否产品化,这是硬差距。
Jacob:只是早接触吗?还是更多?
Peter:不仅是早接触,你还能与后训练团队协作,把模型调得在你产品关键路径更亮眼。OpenAI/Anthropic/Meta研究人才都很强,他们能把产品侧目标反馈成“训练目标”,让模型在特定维度上被强化。…… 这里也有初创机会。模型公司内部注意力容易被“通往通用智能"拖走,没有余力深挖所有垂直领域。初创公司可以100%聚焦一个用例/独特市场信号,快速迭代,做出解决问题的最佳体验”。我们共同投资的一些深度垂直应用已经证明ChatGPT这种通用工具做不到,它们的工作流完全不同。
Jacob:工作流差异非常大。也再一次印证"专门后训练+专门评测体系"=差异化。早期大家以为"工作流包装+通用模型"就够了,现在显然不止。
Peter:当你视角更聚焦,就能跑更快。这是创业公司的优势。
Jacob:有没有你"完全不投"的领域,觉得最终会被模型公司直接吃掉?
Peter:可能是样本偏差——我见到的创始人基本都知道自己的边界,我几乎没看到正面对抗OpenAI主方向的方案。
Jacob:用户侧、代码侧还是有人正面打。常见思路是:"如果这是万亿美元级支出,基础模型公司终会重视;低于那条线,可能顾不上"。小些就没人管。
Peter:这个说法我认同,就是这样。在这些公司里,边际人力特别贵,你希望"让最多的船浮起来"。剩下那些"需要特制脚手架的船",留给创业公司——那也不是小市场。
Jacob:对,2亿美元市场对它们来说可能太小。你在不同组织带过产品。AI First的浪潮下,产品经理(PM)的角色会怎么演变?
Peter:关键还是"脑力预算怎么花"。我们像"人形GPU"一样,每天真正敏锐的也就那几个小时,之后下降,需要恢复。角色专业化仍有意义:即便"代码能从指尖流出",还是得有人真正思考架构与抽象层级。抽象层会继续上移,但永远需要有人对工程、设计"有最后责任感":设计捍卫简洁与可感知,工程捍卫扎实与规模扩展。
对PM来说,很大一块是"心智模拟":终局愿景、下一步、如何降低通往终局过中的摩擦。现在ChatGPT已经是PM最好的伙伴了。深夜1点,所有人下线,家里寂静,我还能有个永不疲倦的思维对手,帮我把规格/愿景文档里最后那句难啃的句子打磨到准确表达那个"模糊想法"。这太强大了,所有角色都会被放大杠杆。
Jacob:长期会"更多PM"还是"更少PM"?组织会发生哪些变化?
Peter:很难说。角色名称本来就在不停重构。很可能出现"全栈单人产出"的主流原型。现在已经有很多"一个人+全套AI工具"开发完整功能/产品的例子了。到时候也许不再叫PM或Engineer,而是"混合创造者"。他们的起点是技术背景还是设计背景都不重要。我在OpenAI有个非常优秀的工程师,后来才发现他是学设计出身。我当时特别惊喜。这正体现工具带来的"技能迁移杠杆":你能把愿景完整落地,AI补足你的短板。所以PM可能"淡化",也可能"技术化",未定。我们已经在一个职业生涯里见过多轮PM形态迁移。有的公司PM更像"市场/叙事"角色(如某些Apple/Microsoft团队),在Facebook则更偏"技术+设计+增长逻辑"混合型。所以变形是常态,还会继续变。
语音AI和教育AI
Jacob:换个话题谈“模态”。你做过语音,先说语音。你如何看语音在未来AI应用交互里的定位?
Peter:……语音的解锁点在于:第一,它让“思维生成速度≈输出速度”。你把这一期播客转成文字,会发现我们俩中途多少次"停一下—换个说法—再往前"。说话几乎同步于思考,不像打字或写作有显著产出延迟。所以你是"边想边外化",这对模型交互价值巨大。语音模型在语气、温度、情感纹理上越来越自然。看看Sesame团队做的东西,真的是魔法。你和它对话,有股说不出的灵性。它展示了一个能表达细腻情绪的媒介正在成形,像训练有素的演员那样,通过声线暗含情绪意图。非常强大。从应用侧看,语音已经进入很多"原本无法覆盖"的工作流。
Jacob:语音让我好奇的是哪些场景会留下来?现在语音智能体很多:我的智能体给你的智能体打电话。如果双方都是智能体,未来可能出现更高效的"数据交换协议"。那哪些用例是真正适合语音?我很喜欢两个点:一是相比文本,语音对话参与感更强;二是它消除了"空白输入框带来的心理摩擦",你可以在思路还没成型时就开始"口述探索"。
Peter:我开车常用Granola。比如我在构思一个投资猜想,一路"起念—否定—再起—再折返"。到终点,它会给我一个"半结构化总结",像一个"听懂上下文的智能体"帮我梳理哪些是洞察,哪些是噪音,在哪一刻迸发了灵感。这是非常棒的体验。语音是一个还远未挖透的媒介。我不知道最终哪些会规模化沉淀,但语音在人类社会存在这么久——肯定会是一个常驻层。
Granola官网
Jacob:对。头脑风暴仍是极高效的"创意生成引擎"。你在Lenny的节目里谈到"模型在教育里的威力",提到陪孩子做作业。你看到最有意思的应用是什么?
Peter:教育这块——现在很多初创在冒头,很清晰:模型在"个性化助思"上很强——比如"别直接告诉我答案,帮我一步步想"。我早期常用ChatGPT跟儿子一起。坦白说,有些长除法——你很久没算,会卡住。可以去看个5分钟视频,也可以直接问:"帮我回忆下步骤""这道题我拆不清楚"。我举过一个例子:晚上脑力枯竭,还要辅导女儿或儿子作业。很快你就会体验到——等你当父亲,五年后你会说"我忘了,而且我现在太累,需要一点动力"。这是一个典型的频繁工作流。
Jacob:第一波成功的是"语言学习"——有口语交互更沉浸。核心难题其实是"参与度",始终会有一批高度自驱的人,但怎么让普通人持续投入?
Peter:是。我觉得AI可以帮忙。学习高度依赖"兴趣被点燃"。顺着孩子兴趣去,是点燃长期好奇心的关键。我们家也坚持这一点。比如女儿迷马,就送她去马术营。跟随兴趣,培养"终身学习爱好"。AI不只是"把题干改成足球背景"这么浅,它可以更深做"触发—引导"。Sal说的没错:如何"拉进来"。我特别好奇:我们能不能让AI更主动,先开口?我最喜欢的一个内部发现就是:"如果是模型先说话,会怎样?"
Jacob:展开讲讲。
Peter:传统是,我提问—它回答。但你完全可以提示它"先打招呼、先提建议、先抛一个模糊提问"。那它不再是"等你召唤的助手",而是"具有初步主动性"的协作者。我非常期待更多"前摄式体验"出现。
Jacob:有没有已经产品化的例子?
Peter:有。我们投的一家公司Yutori,会主动提醒你外部发生的某些事件,引导你介入。当然这只是第一阶段。之后会有更多层级的主动机制。现在很多体验还是:一个空白输入框——“你自己想吧”。10%的人做出巨大价值,因为他们知道怎么用。剩下大多数人其实是困惑的。转向"主动协助"会非常有趣。
Yutori官网
Jacob:和你刚加入OpenAI时比,现在AI模型在C端和B端的扩散情况,有没有超出你的预期?
Peter:我加入后他们跟我说:我们想找一个同时懂"消费端+企业端"的人。因为ChatGPT本质上是一个"工作型产品/生产力工具"。所以我们齐心决定做ChatGPT Enterprise——因为企业需要特定能力:安全、集成、审计、团队内权限/隔离、数据不外泄等等。团队现在还在不断补这些底座。在这些底座成熟前,企业采用本来就会"慢半拍"。C端一开始主旋律是"害怕"。我们招第一位产品营销负责人,我最后面试问她"你有什么问题?"她说:我专门打给几个中西部普通用户聊感受。那会儿在硅谷之外"看好AI"并不常见,主流是"好吓人"。一旦大家真用起来,恐惧淡掉,实用性凸显。过去18个月就是这个过程。
AI人才战的影响、对Meta未来的方向猜测
Jacob:最近"AI人才大战"很激烈,薪酬飙升,大量人员流动。你觉得这会怎么影响生态?
Peter:市场的指向基本值得信任。研究人才对这些实验室是"生命线级资产"。留住、招来都是生死问题。真正赢家反而是"其它所有人":投资人、创业者、公众。因为"竞速AGI/超级智能"对人类有利。副作用是,不少非研究岗位的人觉得自己贡献巨大,但薪酬/股权差距拉大。HR得想办法。
Jacob:会不会扩散到其它角色?我和一些创始人聊,他们会想"要不要像扎克伯格那样,花超高薪挖关键节点的人?"
Peter:我们刚看到一个公开职位,开出极高薪资,在X发出来,引发争论——有人说"太高了"。市场会重新锚定,当前这是最稀缺的角色,理应高估值。未来可能轮到别的(角色)。
Jacob:回到定价,这也是"劳动替代型智能体"公司牛市逻辑之一。大家都号称"替代某类劳力"时,会不会互相压价?"替换劳动力预算"这个市场是不是被过度想象?现在趋势是:如果某工具对一个角色"全方位明显更好",就能守住定价权。
Peter:但无论现在定价权多高,都要往后推演两三阶,未来要保持优势需要怎样的"下一层抽象"。
Jacob:有例子吗?
Peter:太多公司转型、做第二曲线。我有一个隐喻——每家公司都有一个"当前特长跳板",用它跳到下一块,再接着跳。Facebook是好例子,Mark雄心极大。从校园站→年轻人→全球社交基础设施→精准广告机器→硬件+新平台→现在冲超级智能。典型"提前布局下一层"的创始人。
Jacob:你觉得Facebook的AI战略往哪走?
Peter:我不在那工作了,只能基于公开信息谈。Mark说"个人超级智能"我信。人人都需要一个"能协助日常生活"的东西。如果真能为每个人提供一个"高度个性化、能做有意义事情、帮你达成目标"的智能体,价值巨大。也有很多初创在做其中局部,这会是一场竞赛。
Jacob:那和ChatGPT是一个东西吗?
Peter: "智能体"这个词现在被严重透支。今天的大多数所谓"智能体"其实还不是(真正的智能)。它们最多"多想几步",还没有"真正行动所需的全链条工具"。能想、能说、能看(多模态输入)并帮你思考,但还不能"真正帮你订餐/重排日程"到全自动。大家都在冲这个圣杯,还没人真正拿到。OpenAI自己也不会说"我们到了"。那才是终极目标。
Jacob:Google、Facebook、OpenAI都在争一个"消费终端入口"?还是会多家并行?会不会最后只有一个"主日常智能体"?
Peter:不会只有一个。人类需要"多样入口"。我同时用Facebook和Instagram。iPhone也不是只有一个App。差异化会落在"进入语境、心智框架、使用期望"上。产品的微妙之处都在这。
Jacob:有没有对它们"分工形态"的早期猜测?
Peter:大公司会用好各自分发基座。执行得好,可以极具影响力。Google有Chrome;Meta有Feed、Instagram;它们都有"跳板"进入"真正助理"。未来大致会沿"待完成任务/工作流/独特数据/使用姿势"去切。举个例:我用Perplexity,也用Google,有时Gemini的搜索也够用,我就继续。消费者会有很多选择。公司会努力区分,并把分发价值发挥极致。
从OpenAI 经历、理解AI应用的护城河
Jacob:现在最热门的问题是:AI应用的护城河到底是什么?大家动不动就说别人是套壳,你怎么看?
Peter:第一:独特数据极端重要。大量数据不在开放网页里,模型没见过。举例,如果你是一生,世界上没有多少高质量"真实排班对话语料"被上传;那些语调、协作逻辑不在训练集里。再比如陌生电话销售:书本策略模型读过,但"微妙停顿""语速调节""打断时机"这些有机节奏基本没有。还有顶级咨询的内部推理草稿、拆解框架——模型也没见过。Facebook的独特数据也是这种级别——现实社交强关系图谱。数字化之后你就拥有一个巨型资产。这就是"独特数据"真正的杠杆。所以起点是它。第二:数据飞轮——工作流设计对了,产品、模型可持续迭代。第三:(扩张)速度与市场覆盖——如果一、二成立,你快速攻占市场会形成复利,别人难追。
Jacob:数据飞轮来自"在场景里跑起来",即拿到了持续更新、理解最新模型能力的权利。
Peter:更重要的是,你的"微调后模型"会更擅长"那份工作"。因为起步差异化给了你分发;而在使用过程中,用户在做"隐性标注"——比如一个排班智能体做错2个点,你纠正,这些"偏好/修正"是只属于你的数据。必须要你"深度嵌入"才能采集。
Jacob:一部分会更新到底层模型,一部分只是"外部控制层/结构化逻辑"。我自己在"专有数据价值"上也摇摆过,可能比你更保守一点。因为很多时候需要的样本量没想象那么大。很多领域"几百/一千高质样本+结构化反馈"已经足够。在一个垂直里,最终可能有五到十家公司都拥有"足够"数据,并不会拉开巨大差距。数据本身不必然构成护城河。早期我们以为需要"数十万样本"。事实是:很多场景"质量"比"量"更关键。
Peter:对,现在模型已经好到"少样本微调"也能起步。"独特数据"不是"启动飞轮"的必要条件,可以先飞,再慢慢构筑。但我还是强调,进入真实场景越快越好。……
Jacob:你在ChatGPT上花过很多时间。它有趣的一点是:它被非常多不同子人群使用——一些群体高度兴奋,一些群体有挫败。你怎么解读这种反馈?
Peter:先说ChatGPT真的是整个团队的集体成果,后训练、产品、设计都非常优秀。关于GPT-5带来的各种评论,我一点不惊讶。这和我在Facebook推新版首页、Feed时一模一样:大家会说"你动了我的奶酪"。旧版News Feed上线时用户反感。后来我们做的那版一样,大家抱怨"某功能被挪动",典型的变更管理。我非常理解现在团队面对的这些声音。看到外部反弹我内心就是:"完全符合预期"。这是朝正确方向——减少模型选择的心智负担——再走的一步。我记得我们曾清理一次"模型选择器"获得成功,我离开后又渐渐复杂了。用户确实需要"控制感",于是它回来了。这是所有产品反复出现的"魔法vs控制"平衡。
Jacob:你在OpenAI之前在Uber,一个很有趣的问题是:ChatGPT作为"消费主页"与其他应用(比如Uber、DoorDash)的互动。如果我是ChatGPT产品团队,希望整合越多工具越好;如果我是Uber产品团队,又不希望变成"被动API"。这个平衡怎么走?
Peter:本质是"激励"。会有一些公司更愿意先接入,从而迫使其他公司跟进。每家公司都在做"成本收益权衡"。世界正朝"极简+即刻"前进,消费者会期望"最低摩擦"。到某个时间点,这不再是"接不接入"的问题,而是"在这个新抽象层如何保持差异"。为什么你的智能体会选Uber而不是Lyft?ETA更低吗?可靠性更高吗?你必须证明价值。我认为UI会逐步退场:耳机类设备+主动语音交互。谁拿下哪块,会很有意思,这也是为什么大家都盯着"设备层"。苹果、谷歌有优势,其他公司也在做硬件探索。
Jacob:这对Uber这种公司是不是只有不好的影响?过去它们有"主页",能做交叉销售。未来如果都通过"超级入口"调用,会不会失去这块?
Peter:看历史,iPhone范式给了Uber出现的机会——GPS在每个人口袋里。但那时技术不够成熟,无法"整合所有任务"进一个语义主页。东南亚、亚洲早期的"超级App"形态就是一个类比,部分源自输入习惯与语言环境。语音时代可能会出现新一代的"超级入口"。Uber仍然得适配,避免被完全商品化。UI权重会下降,核心变成"你的价值主张够不够让用户的智能体选你"。
Jacob:Ben Thompson说OpenAI同时做"消费+企业"会有资源/优先级冲突,比如算力分配。你怎么看?
Peter:……确实内部复杂,不只是"企业vs消费"。还可以按"消费/企业/API&平台"切。消费里还包含"企业聊天"。我刚去时甚至很难给自己定一个职位名称。"Consumer"不精确,"Enterprise"又不含API平台客户。组织切法非常多。我离开时他们把"企业ChatGPT"和"消费ChatGPT"拆成两个组,现在又合并——很合理,因为是一个产品。组织结构会随策略摆动,重组不是坏事,是"曝光战略意图"的形式。应用线最终只有一个负责人,要明确未来9~12个月最关键的是什么,组织再对齐。
Jacob:我一直好奇OpenAI的触角之广:机器人、代码、语音、视频……我们可能正进入一个"基础模型公司选赛道"的阶段。Anthropic似乎淡出消费聚焦代码/企业;OpenAI仍然野心极大。过去几年它们几乎没怎么"失手"。在你还在的时候,有没有哪件事没按初始设想走?
Peter:与其说失败,不如说"换方式"。比如SearchGPT——一个独立入口强调搜索体验。它的存在是必要的,让组织围绕"默认具备搜索能力"对齐。后来再折回主产品。这不叫失败,是策略演变。创业公司前期也是如此:你学到→你调整。成长心态与适应性是所有世代级公司的共同点。
Jacob:在这个时代,这种节奏被进一步放大:你做的东西,半年后被基础模型吸收,但你不后悔,因为当时它是获取洞察与分发的必要渠道。
Peter:完全同意。Anthropic乃至所有成功创业公司的创始人都要有这种"学了就跳下一块"的特质。这就是伟大产品的诞生方式。
Jacob:OpenAI的文化和其它相比有什么不同?
Peter:所有我待过的组织都有雄心。但OpenAI的"敢想半径"更大。每次全员会后,你会觉得"认知天花板被再抬了一截"——讨论智能体做研究、自行延展、持续推进科学等。那种乐观拉伸感很强。我本来是乐观主义者,做投资有时要克制,但在那里的经历还是把我乐观的上限再推高。这个很独特。
Jacob:最后是快问快答。现在AI领域一个"被高估的"和一个"低估的"是什么?
Peter:被高估的是,今天的"智能体"(就目前的能力而言)。它们还不配这个标签,真正具行动力的"智能体"还没到。被低估的是评测(Evals)。听上去枯燥、像杂活,但它是真正"塑形模型行为"的关键杠杆,严重被低估。
Jacob:你觉得评测工具会产品化吗?
Peter:我觉得有共性层,能产品化,只是它太"不性感"了,不容易被注意到。已经有一些做强化学习环境/评测编排的创业公司出现,这很好。但整体仍被低估。它可能是很多应用里"最关键那层"。一个未知是,它会成为"平台"还是"深度嵌入咨询式"形态。拭目以待。
Jacob:如果你现在不做投资,要自己做一个AI应用,会做什么?
Peter:我可能会进入一个"大家觉得无聊"的行业,那里往往藏着巨量可优化的重复劳动,人力可以被重新配置。再具体些,我认为"AI语音"是巨大的(机会),我们对语音在"业务流程"中的潜力挖掘还刚开始。
这听起来和我过去在Uber、Instagram、Facebook履历不一样,但我一直迷恋深入行业结构、系统级效率问题。可能这也是我当年喜欢Uber的原因——原子从A到B的转运效率太硬核。语音+真正的智能体能释放大量人不想做的琐碎劳动。比如呼叫中心,就是我一直盯着的方向,它完全可以被重构。
……
作者:MD
出品:明亮公司
来源:财经涂鸦