Gemini 打赢翻身仗:谷歌搜索 VP 复盘如何靠不满足重塑 AI 搜索

B站影视 港台电影 2025-10-12 07:42 1

摘要:过去两年,尽管生成式 AI 浪潮席卷全球,但谷歌作为 Transformer 论文的开创者,在消费级 AI 领域似乎一直慢半拍。甚至有人开始质疑,ChatGPT 和 Perplexity 会不会威胁到谷歌的搜索帝国。

几周前,GoogleGemini 出人意料地超越 ChatGPT,登顶美国 App Store 排行榜第一。

过去两年,尽管生成式 AI 浪潮席卷全球,但谷歌作为 Transformer 论文的开创者,在消费级 AI 领域似乎一直慢半拍。甚至有人开始质疑,ChatGPT 和 Perplexity 会不会威胁到谷歌的搜索帝国。

Gemini 的登顶似乎是一个信号:谷歌正在重新找回领先地位。不论是 Gemini 2.5 Pro 的模型硬实力,还是 Nano Banana 的娱乐性,都为谷歌赢得了许多用户。

Google 搜索产品副总裁 Robby Stein 接受了知名播客 Lenny’s Podcast 的采访,Robby 在加入谷歌之前是 Instagram 消费产品负责人,打造了 Instagram Stories、Reels、Close Friends 等产品。现在,他负责着 Google AI Overviews、AI Mode、搜索排名、Google Lens 等核心功能。

这次采访让我们有机会一窥谷歌 AI 战略的内幕,了解他是如何看待 AI 与搜索的未来,以及背后的产品哲学。

我现在的感受是,一种不可思议的专注和紧迫感。

当被问及谷歌内部究竟发生了什么变化时,Robby 这样回答。

他认为,这种变化并非源于某一次重大的组织架构调整或某个「救世主」的空降。相反,他将其归因于一种「复利效应」——当团队每个月都不断改进产品和模型,日复一日地精进,最终会迎来一个引爆点 。

这些模型现在真正达到了可以为消费者提供价值的临界点。

这种「专注和紧迫感」与领导层的推动、以及与 Google DeepMind 等研究部门更紧密的合作密不可分。当顶尖的研究能力与产品团队的敏锐嗅觉高效协同,谷歌这台庞大的机器开始以前所未有的速度运转。

Robby 强调,外界常常倾向于将巨大的势能归功于某一次变革或某一个人,但真正的驱动力,往往是持续不断的、朝着正确方向的微小改进。这种「无情改进」的理念,正是他产品哲学的核心之一。

在过去两年里,「搜索已死」的论调不绝于耳。许多人预言,用户会抛弃传统的「蓝色链接」,转向能直接给出答案的 AI 聊天机器人。

然而,Robby 带来了来自谷歌一线业务的不同观察。

我们看到的核心事实是,人们来搜索所做的事情,其范围之广,令人难以置信。他们可能想找一个电话号码、查询一个商品价格、获取导航路线,或者找到一个缴税网站。这种需求的广度被很多人低估了。

AI 的出现,并未改变这些基础性的信息需求。谷歌的内部数据显示,传统搜索的根基依然稳固。更有趣的发现是,AI 对搜索而言,是「扩张性的」,而不是替代性的。

现在,有越来越多、越来越复杂的问题被提出,人们的好奇心可以被更好地满足。

AI 正在创造新的搜索场景,而不是蚕食旧的场景。

他以 Google Lens 为例。这个多模态搜索产品正在以惊人的速度增长,视觉搜索量同比增长了 70%,而这已经是在一个数十亿次搜索的巨大基数上。用户现在可以拍下自己的鞋子问「在哪里可以买到?」,可以拍下孩子的化学作业问「第二题我卡住了」,甚至可以拍下自己的书架说「根据这些书,推荐我接下来该读什么?」

这些在过去难以通过关键词描述的复杂、开放式问题,如今正在通过 AI 驱动的多模态搜索被解决。这证明了 AI 并不是在和传统搜索进行零和博弈,而是在共同把「信息获取」这个市场的蛋糕做得更大。

为了应对这个被 AI 拓宽的搜索世界,谷歌精心布局了三大核心体验。

1. AI Overviews

这是大多数用户最先接触到的 AI 体验。当你在谷歌输入一个自然语言问题,搜索结果页顶部会出现一个由 AI 生成的、简明扼要的摘要。它旨在快速满足用户的直接信息需求,并提供深入了解的链接。

2. Multimodal Search

以 Google Lens 为代表,这是增长最快的领域。它打破了文本的束缚,让物理世界成为可搜索的对象。这是谷歌应对「灵感」、「探索」类需求的利器。

3. AI Mode

这是整个战略中最具雄心、也最值得关注的一环。你可以通过 google.com/ai 直接访问。Robby 形容它为「一个端到端的前沿搜索体验」,一个真正让你「向谷歌提问任何事情」的地方。

那么,AI Mode 究竟特殊在哪里?

首先,它不仅仅是一个连接到大语言模型的聊天框。它的核心优势在于,它被专门设计用于搜索,并深度整合了谷歌独有的、庞大的结构化数据网络。

Robby 透露了一个关键细节:

比如,Google Shopping 图谱中有 500 亿个商品,商家每小时更新 20 亿次价格;Google Maps 中有 2.5 亿个地点……AI Mode 可以调用所有这些实时、高质量的信息。

这意味着,当你询问复杂的购物或旅行规划问题时,AI Mode 给出的不仅仅是来自网络的文本总结,而是结合了实时价格、商家信息、地理位置等结构化数据的、可执行的建议。

其次,它的工作机制也与众不同。

其背后是一个名为「Query Fan-out」的机制。当你提出一个问题,模型会像一个研究助理一样,将其分解成数十个子查询,并利用谷歌搜索作为工具在后台进行多次搜索。

它会向实时数据后端发出请求,检查信息源的权威性,甚至利用谷歌搜索多年积累的垃圾内容识别能力来过滤信息。

AI 帮你完成了研究和信息整合,它在不断地检查自己的工作,以确保信息的准确性和帮助性。

AI Mode 不是一个像 ChatGPT 那样的通用型聊天机器人,而是一个专注于「信息性需求」的超级搜索工具。 它不追求陪你闲聊或扮演心理治疗师,它的唯一目标,就是为你的问题提供最全面、最准确、最可信的信息,并引导你到权威的信源进行验证和深入探索。

AI Mode 从概念到发布用了一年左右的时间,这一年里发生了什么?

起点:一个强烈的用户信号

团队注意到,越来越多的用户在搜索框里输入长问题后,会在末尾加上「AI」这个词。他们在「请求」谷歌用 AI 来理解他们更复杂的意图。

我们看到这些查询时,感觉就像是我们每天都在辜负用户我们必须为此做点什么。这种来自用户的、未被满足的强烈需求,是最大的动力。

孵化:一个 5-10 人的小分队

项目启动时,只有一个由几位技术负责人、几位设计师组成的微型团队。他们像创业公司一样,从一张白纸开始,探索一个全新的、可以进行对话式搜索的界面。

验证:「Aha Moment」

初版产品很粗糙,但业展现了惊人的潜力。Robby 回忆起一次经历,他为了给女儿策划一次出行,向早期版本的 AI Mode 提了一个复杂的问题。模型不仅找到了公园信息、开放时间,还链接到官网,甚至结合地图信息判断出路线是否适合婴儿车通行。

这个「Aha Moment」让团队坚信,他们走在正确的道路上。

迭代:从「朋友与家人」到「Labs」

在正式发布前,AI Mode 经历了两轮关键的测试。

首先是大约 500 人的「可信测试者」计划,其中也包括朋友和家人。这些反馈是产品改进的关键。

当产品打磨到一定程度后,它被放入 Google Labs,让更广泛的用户可以主动选择试用。这为团队带来了海量的真实查询数据,帮助他们更好地调整和优化模型。

发布:从美国到全球

最终,在 Google I/O 大会上,AI Mode 正式向所有美国用户开放,并开启了向全球市场和多语言扩展的旅程。

从一个用户洞察,到一个改变搜索未来的核心产品,AI Mode 的一年冲刺,正是谷歌「新节奏」的最佳写照。

在访谈中,Robby 分享了他沉淀多年的一套产品哲学。他开玩笑说,如果他要写一本关于如何打造伟大产品的书,大概会有一个序言和三个章节。

序言:不懈改进

不懈改进是 Robby 最核心的理念。

有一次在 Instagram 的团队会议上,Robby 发短信问妻子:「用一个词形容我。」妻子秒回:「不满足 (dissatisfied)。」

起初他有些哭笑不得,但妻子随后补充道:「你不是不快乐,而是你发自内心地渴望世界变得更好。你对世界呈现给你的样子感到不满足,这驱使着你去改变它。」

不满足便是 Robby 的核心驱动力。他引用了 iPod 之父 Tony Fadell 的一个著名比喻:我们成年后,会对生活中的种种不便「习惯化」,比如水果上的那张讨厌的贴纸,撕下来时总会弄破果肉。但顶尖的产品人,会像孩子一样,对这些不便保持永不妥协的「不满足」,并追问「为什么不能更好?」

第一章:深刻理解用户

虽然听起来是老生常谈,但 Robby 强调的是要理解用户行为背后的因果关系

Robby 是「Jobs to Be Done (JTBD)」理论的忠实拥趸。他认为,用户不是在「使用」你的产品,而是在「雇佣」你的产品去完成某项任务。你必须像侦探一样,探究用户「雇佣」你的产品那一刻的因果关系——他在哪里?和谁在一起?是什么触发了他?

理解用户到底想完成什么「工作」,能让你跳出当前产品形态的限制,从第一性原理思考解决方案。

第二章:严谨的分析

光有同理心不够,你必须能够通过数据进行根本原因分析。当指标下降,你要能层层下钻,定位到问题是出在某个地区、某个设备、某个用户群体,还是某个具体的交互环节。

第三章:为清晰而设计,而非为巧妙

Robby 引用了设计大师 Don Norman 的经典案例:为什么我们至今还会推拉错一扇门?因为设计师为了追求对称和美感,牺牲了操作的清晰性。

他告诫产品经理,不要过度迷恋于创造独特的、聪明的交互或图标。当一个设计模式已经成为行业标准时,遵循它,你会获得巨大的杠杆效应。

案例研究:「密友」功能

Instagram 的「Close Friends(密友)」功能是这套产品心法的完美实践。这个功能的最初版本其实彻底失败了,前后耗时两三年才打磨成功。

理解用户 (JTBD): 团队通过调研发现,许多用户不敢发 Stories,是因为观众太复杂(有前任、有老师、有爱评判的朋友)。他们真正的「Job」是想在一个更私密、更安全的环境里分享脆弱、真实的一面,并获得朋友的回应,感受到「连接」。失败原因::最初的版本叫「Favorites (收藏)」,并且功能过于复杂,可以用于 Feed 和 Story。但「Favorites」在很多语言里被误翻译为「Best Friend (最好的朋友)」,导致用户只添加一两个人。分析洞察::数据显示,当一个用户的密友列表有 20-30 人时,产品才开始「工作」。因为这个规模能保证每次发布后,至少有几个人会通过私信回复,从而完成了「感到与朋友连接」这个核心的情感任务。清晰设计::团队将功能简化,只保留在 Stories 中,并将名字改为「Close Friends」,鼓励用户添加一个小组而非一两个人。同时,在 Stories 头像外圈加上了标志性的绿色圆环——一个极其清晰的视觉信号。

正是通过这套「理解-分析-简化」的流程,和长达数年的「不懈改进」,Close Friends 才从一个失败品,变成了 Instagram 最受欢迎的功能之一。

谈到 Instagram,就无法回避 Stories 的诞生。当年,这一功能因其与 Snapchat 的高度相似而备受争议。

Robby 认为,你不可能发明所有伟大的东西。

当一种新的内容格式(比如信息流、短视频、Stories)被证明是成功的,它很快就会成为一种「行业原语 (primitive)」。此时,如果你固执地不去拥抱它,「你实际上是在剥夺你的用户群拥有一个更好产品的机会。」

关键不在于是否借鉴,而在于如何为你的用户和产品生态,做出更好的版本。

Instagram 做了三件关键的事,让 Stories 成为自己的东西:

提供了更强大的创意工具,比如霓虹笔刷和更精致的滤镜。解决了用户的核心痛点:Snapchat 当时不允许上传手机相册里的照片,这违背了用户希望分享高质量、精心拍摄照片的习惯。Instagram 开放了这一功能。优化了微交互:Snapchat 的 Stories 无法暂停,播放速度很快。而 Instagram 增加了「长按暂停」功能,这是一个微小但实用的改进。

最终,Instagram Stories 成功了,甚至让人感觉本来就该如此。模仿成熟产品的范式并不可耻,重要的是能否抓住用户的核心痛点,做出属于自己的改进。

最后,Robby 提出了一个与硅谷主流叙事相悖的思考:过度迷恋「精益」和「小团队」,正在让许多团队过早放弃。

我看到太多团队,因为投入不足,产品始终不够好,无法获得足够的内部动力,在萌芽阶段就夭折了。

Robby 认为,尤其是在构建基于底层技术突破的、复杂的软件产品时(比如 AI),你需要足够的资源来打造一个「足够好」的版本,让它能够真正展现其魔力。Close Friends 如果是一个创业项目,可能早就因为漫长的开发周期而死掉了。

他的建议是:

在验证信念的阶段,保持小团队,快速迭代,获得内部信念。一旦你通过小范围测试验证了产品的核心价值,就必须果断投入足够的资源,去打造一个能赢得外部市场的、高质量的产品。

你不能指望一个永远「精益」的团队,去解决一个需要规模化投入的复杂问题。

谷歌凭借 Gemini 和 Nano Banana 打了一场翻身仗,但也许只是暂时的赢家。

正如 Robby 所说,最重要的品质是「好奇心」,要用永不满足的好奇心驱动模型研发和产品进步。

AI 也许会改变下一代人和信息交互的方式,这是当下最值得关注、值得思考的科技变革。

来源:不二小段

相关推荐