“AI搜索”万字调研:概念、商业、产品、技术

B站影视 日本电影 2025-09-25 10:07 1

摘要:AI搜索不是旧瓶装新酒,而是信息分发逻辑的根本重构。本文将从技术原理、产品机制到商业模式,系统解析AI搜索的演化路径,并探讨它如何重塑用户行为、平台生态与品牌策略。

AI搜索不是旧瓶装新酒,而是信息分发逻辑的根本重构。本文将从技术原理、产品机制到商业模式,系统解析AI搜索的演化路径,并探讨它如何重塑用户行为、平台生态与品牌策略。

为什么写这篇文章?

这篇文章,我将从概念理解、商业思考、产品分析、技术调研的角度,深入的研究AI应用领域的关键模块:AI搜索;全文1.8万字,阅读需要20分钟,三白历时2周整理创作,我将分享如下几个话题的内容:

AI搜索和传统搜索的区别是什么:从交互形态、底层技术、商业模式、生态影响的角度深度理解;AI搜索引发的商业思考:包括广告模式和订阅模式的取舍,用户体验和商业化如何平衡?AI搜索赛道调研:包括赛道划分、玩家布局、竞争策略如何?AI搜索产品分析:主要分享如何评估一个AI搜索产品的好坏?AI搜索技术调研:企业如何底成本时间AI搜索能力;AI搜索未来思考:AI搜索未来可能的发展方向;

之所以要专项研究AI搜索这个领域的内容,一方面主要是我负责的AI应用在产品迭代更新的过程中,开始遇到更多关于AI搜索相关的技术问题,为了寻找更好的解决方案,我需要做一个专项调研。

其次,我相信未来几乎所有的AI应用产品,都将离不开AI搜索的能力的探索,因此所有的AI从业者,特别是AI产品经理,都会和我一样遇到同样的问题,基于此,我将自己的学习和研究成果分享给大家,希望对正在从事AI领域应用的朋友有点帮助。

一、AI搜索和传统搜索的对比

AI搜索和传统搜索的区别是什么?

接下来我们尝试从结果交付模式、底层技术、产品形态、商业模式、生态等多个角度,由浅入深的理解AI搜索和传统搜索的区别。

1.从检索结果的交付模式上看

从用户最直接且肉眼可见的交互方式上,传统搜索的检索结果交付模式,是先基于用户输入的内容拆分关键词,然后搜索引擎通过关键词匹配与之相关的内容链接,这个搜索结果只是告诉用户,我给你的这些内容里面有你想要的答案,但是你得自己打开,然后自己寻找答案;

而AI搜索首先不是基于关键词拆词然后去匹配结果,而是先基于大模型理解用户输入问题的意图,然后基于意图去匹配与之相关的内容,并且在自行获取内容内的信息片段之后,直接生成用户问题对应的答案。

形象一点比喻,传统搜索就像一个图书馆员,只给你一堆你可能想要的书的编号(对应网页链接),让你自己找到书籍然后阅读后自己寻找答案;而AI搜索相当于你的助理,不仅理解你的意图,还帮你获取信息,加工提炼,最后推给你最终想要的答案。

很显然,AI搜索的模式对用户更加友好,不仅承担了更多的工作,还极大的降低了用户的认知符合。

2.从产品形态上看

从是否具备上下文记忆的角度看

传统搜索:每一次检索都是单次、无状态的“请求-响应”。你输入查询,它返回结果,这次搜索就结束了,下一次搜索是全新的开始。AI搜索:具备多轮对话、理解上下文的特点。你可以像和人聊天一样,不断追问、澄清、调整需求。AI会记住上下文,让信息获取过程更像一次自然的探索,而非机械的查询。

从处理任务的复杂度上看

传统搜索:擅长事实查找事实和结果类任务。例如:“中国的首都是哪里?”,这种问题是已经有明确的答案和结果,但是如果该问题目前没有答案和结果,搜索引擎将无法返回结果;AI搜索:能够处理探索性、创造性、规划性任务。例如:“为我的初创公司起草一份关于AI在市场营销中应用的初步商业计划大纲。”,这些是在互联网信息里面不一定存在的东西,但是模型可以基于目前能检索的到东西,以及基于模型的推理能力,给出相应的参考答案;

3.从底层的技术实现方式上看

内容检索背后的技术:传统搜索引擎的核心技术是关键词匹配和拓展,实现对对用户输入的关键词进行分词、语法分析、同义词扩展,该技术的核心是词法层面的操作。而AI搜索利用LLM的强大NLU能力,深度理解查询背后的复杂意图、上下文、约束条件,依托的是自然语言理解和意图识别算法的能力;结果交付背后的技术:传统搜索引擎交付结果的核心技术可以理解为一套排序算法,是对检索到的页面链接做排序,算法背后依托的数据是页面链接对应的数据信息(链接、内容质量、用户行为、新鲜度等),核心关注的是链接的权威性和相关性; 而AI搜索交付结果的核心技术,除了页面链接的排序算法,还涉及对链接内的内容做向量化处理(把内容转换成大模型可以理解的信息),并从内容中检索到与问题最相关的知识片段,最后将结果交付给大模型作为时候上下文生成答案;也就是说AI搜索背后的技术是包括:

页面链接排序算法向量化技术知识片段排序算法LLM增强生成技术(大模型基于上下文生成答案)

检索背后的数据结构:传统搜索背后构建的是“关键词 -> 文档列表”的映射数据,这是实现关键词快速匹配的基石。而AI搜索除了以上映射,还需要构建向量数据库(可以理解为知识片段的数据库);

4.从商业模式上看

1)从两者的盈利模式上看

传统搜索:核心模式主要以广告竞价排名为主,搜索引擎是最大的互联网流量分发中介,将用户导向其他网站,通过点击广告盈利。这是一个极其成熟且高效的商业闭环。

AI搜索:目前的商业模式还不是非常清晰,整个行业还处于探索中,充满不确定性

增值服务/订阅:提供更强大的Pro版,如PerplexityPro,提供更深入的分析、无限次的复杂查询等。交易佣金/联盟营销:在生成的答案中(如旅行计划、购物推荐)直接嵌入可交易的链接,并从中抽取佣金。这需要更深度的价值链整合。API调用:将AI搜索能力作为服务提供给企业客户。对现有广告模式的冲击:如果用户在搜索结果页就得到了答案,他们点击链接的意愿会大幅降低,这将直接动摇CPC广告的根基。网站主失去了流量,搜索引擎也失去了广告收入。新的盈利可能性

2)从两者的的成本结构上看

传统搜索的成本关键还是运行算法对应的算力和服务器的成本,相对而言,搜索引擎在过去发展那么多年,传统搜索的成本已经可以压缩的很低;而AI搜索核心的成本是大模型的推理成本,并且LLM的推理成本极其高昂,远超传统搜索的单次查询成本。

从这个角度上看,AI搜索目前是一种烧钱,但是有不赚钱,并且还会冲击传统广告收入的产品形态,因此这也是像百度等传统搜索引擎类的公司,对于发展AI搜索产品暧昧犹豫的主要原因,他们处于这样一种状态:如果大力发展则冲击传统搜索广告的收入,如果不发展又会被竞争对手抢夺市场,因此他们干脆就是先以防守的目的先发展着,但是也不作为核心产品去推进;

5.生态影响

传统搜索下的生态存在如下特点:

搜索引擎与内容创作者(网站主)是一种微妙的共生关系。创作者通过SEO优化内容以获取来自搜索引擎的免费流量,从而实现自身商业目标(广告、电商、品牌等),搜索引擎则需要高质量的内容来满足用户,维持其平台价值。并且传统SEO的模式下,内容的创作者除了关注内容质量,会花费大量的精力管理网页的结构、网页注释、关键词铺设、外链索引等工作,因为只有做这些事情,才能提升网站的权重,增加网站的自然排名。

AI搜索生态下,则发生了一下变化:

AI搜索可能成为一个“SEO流量终结者”。它直接消化和重组了内容,用户停留在搜索结果页,不再需要访问源网站,这就意味着传统SEO的工作变得不是那么重要了,这对整个依赖SEO生存的内容产业是降维打击。伴随SEO颠覆,随之而来的新的获得自然流量的方式是GEO,在该变化之下,网页想要获得更高的推荐和自然流量,依靠的不再是结构、关键词、外链索引等工作,而是在于内容的质量本身(因为大模型对于非结构化的数据也有强大的理解能力,也不关注关键词的数量和外链索引情况),因此网页内具有独到见解、深度分析、一手数据、独特体验的“原创”和“高信息增量”内容的网站,会更加受到AI搜索的青睐。因此,GEO之下也将诞生一种新的工作,AIO(AIOptimization),即如何让自己的内容更容易被AI模型采纳、引用,并以正面的方式呈现。

二、AI搜索引发哪些商业问题的思考?

2.1 AI搜索产品的商业模式是什么?

1.广告模式是否依然是AI搜索产品最核心的商业模式?

对于这个问题,目前市面上普遍存在3种观点:

第一类观点:广告模式依然是AI搜索产品最关键的商业模式核心观点:广告将继续是其生成式搜索体验(SGE)的重要组成部分,用户在寻找信息的过程中,商业信息本身就是答案的一部分,是有价值的。

代表派系:以谷歌、微软、perplexity等公司为代表,他们目前正在用行动支持和验证这个观点,尝试在AI搜索问答的答案中植入广告,并且google对外宣称在总体变现上并未被侵蚀;策略:他们的策略是在不破坏用户信任的前提下,谨慎地实验新的广告形态。例如,在AI生成的摘要下方或旁边保留明确标注的“赞助”链接。核心原则是“演进”而非“革命”,在保护现有广告收入的同时,逐步探索与AI答案共存的新模式。

第二类观点:订阅制和交易佣金将取代广告,成为核心商业模式核心观点:AI搜索的产品形态与传统广告的商业逻辑存在根本性的、不可调和的矛盾,订阅制和交易佣金将取代广告,成为核心商业模式;

代表人物:以全球科技行业最具影响力的独立战略分析师之一Ben Thompson为例,他认为谷歌等传统搜索引擎的核心商业模式是“聚合用户,分发链接”,并通过CPC(按点击付费)广告将流量变现。而AI搜索的终极形态是提供“零点击”的完美答案,这从根本上切断了流量分发的路径。订阅制(为高级功能付费)和交易佣金/联盟营销(在生成的方案中直接促成交易并抽成)将取代广告,成为更有可能的核心商业模式。广告即便存在,也将沦为次要角色。

第三类观点:混合模式

一个由广告支持的免费基础版,服务于大众用户。

一个无广告、功能更强大的订阅版,服务于专业用户和企业。

在免费版中,广告将以更原生的方式(如在答案中无缝植入产品推荐)呈现。

核心观点:增值付费,免费用户通过广告的方式商业化

代表机构:Business of Apps (应用商业分析平台)

对于以上三种模式,个人更加倾向于第一类观点,认同未来广告依然会是AI搜索产品的核心商业模式,其中个人主要思考如下:

传统的搜索广告平衡了搜索平台、广告主、流量主、用户多方的需求,以及这个生态的平衡,AI搜索如果完全颠覆掉这个平衡,完全向用户体验倾斜,广告主和流量主的需求无法得到满足,搜索平台也不会愿意做这样的事情;另一方面,个人认为,AI搜索产品在支持广告的模式下,用户体验和广告商业化并不是完全的无法取得平衡,加入广告必然是会有损体验,但是只要控制好度,也并不完全会让用户反感;增值订阅的模式无法造就广告体量的收入规模,更加不可能造就像谷歌这样的公司,对于这个问题,我们在后面部分继续论证;对于混合的模式,个人认为订阅和广告可以共存,但是用户增值付费的原因一定不是为了去广告,而是为了获得更强的搜索能力,比如deepresearch,专业检索数据源等,所以即使是混合的模式,付费用户依然可以有广告;

2.增值订阅模式是否有可能替代广告模式对于这个问题,众多市场分析师和媒体评论员及有影响力的科技分析是普遍认为增值订阅模式带来的商业规模无法达到广告模式的规模,更无法造就像谷歌这种体量的企业,依据主要包括如下:

以现实的行业数据为例,谷歌2024年的广告收入预计将超过2500亿美元。而要通过订阅达到同等规模,假设订阅费为每月10美元(年费120美元),则需要超过20亿的付费用户,这是一个什么样的概念;作为对比,全球最成功的流媒体订阅服务Netflix,经过多年发展,付费用户数约为2.7亿,2024年的收入规模大概390 亿美元 (数据来源:Netflix FY2024 财报); 另外再看最成功的生产力订阅软件Microsoft 365,订阅用户数也就大概5亿以内,2024年的营收825 亿美元 (数据来源:微软 FY2024 财报)。 可想而知,要达到20亿的付费用户规模,年营收规模达到2500亿美元,其难度可想而知,因此在量化评估上,就否定了订阅模式替代广告模式称为巨头的核心商业模式的可能性;

愿意为搜索付费的用户群体,主要集中在开发者、金融分析师、研究员、重度内容创作者等“知识工作者”和科技爱好者。这个群体虽然有高价值,但其绝对数量与全球数十亿的互联网用户相比,只是冰山一角。广告模式的优势在于它可以从每一个“注意力”中榨取价值,无论用户贫穷或富有,而订阅则设置了一个很高的准入门槛。

因此,AI搜索产品中,采用订阅制可以造就一家类似Perplexity.ai这样的成功企业——估值数十亿美金,服务于百万级专业用户。但要达到谷歌、微软这样的万亿市值规模,仅靠订阅是天方夜谭。

当然,以上这些都仅仅是大家的观点而已,在现实的商业世界里面现在并没有获得验证,比如谷歌的AI搜索,目前也并没有贡献很高的广告收入,传统广告依然是收入的核心;而以订阅模式为主的perplexity虽然也有一定的名气,但是也没有造就多大的商业规模,以上问题的答案一定是在未来被印证。

3.AI搜索支持广告模式的情况下,如何平衡用户体验和商业化目标?

AI搜索问答结果中增加广告为什么会破坏用户体验?举个例子,比如你搜索“国内最好的3家保险公司“是谁,对于这个问题,用户需要的是一个公允的答案,一个正确的结果,而如果你加入了广告,强行推荐了一个不合理的结果,就会破坏回答结果的真实性、准确性,也因此带来回答结果的公平性的问题,所以大家第一意识就是会觉得AI搜索中增加广告会破坏用户体验;

但是,如果每次的回答都按照当下的某一个评分规则去排名,得到一个标准答案,也会存在一定的问题,比如从用户的角度上看,用户会陷入信息茧房,搜来搜去都是这几个结果,获取不到新的结果;从推荐产品的角度上,排名靠前的产品永远都获得了优先推荐,而那些当下没有名气,但是有创新活力的新生产品则得不到曝光,显然这也是不合理的;

因此,广告平台未来一定会围绕这些问题,在广告推荐这个问题上,想办法寻找一个平衡的解决方案,比如通常很多平台会采取如下的方式:

方式一:回答的答案中融合”符合主流观点和市场共识的答案“+”新兴视角答案“+”广告答案并添加广告标识“

[主流观点/市场共识]:基于那些经过时间验证的高评分内容,给用户一个最稳妥、最安全的基础答案。[新兴视角/趋势观察]:明确标识出这部分内容来自“近期发布”或“创新观点”,满足用户的探索欲。[广告内容]:这是广告的专属位置,清晰标注,内容上强调它是一个“可选项”或“商业化解决方案”。

通过这个方式,可以尝试去平衡用户对答案的信任度、平台方的广告的需求;

方式二:广告不竞争首选答案,采用补充回答的方式

比如perplexity选择在回答结果的尾巴中,通过追问和补充答案的方式添加广告,如此不会破坏原来的答案;

4.对于平台方而言,如何提升AI搜索的广告规模?

在第三点中,可以看到,广告平台永远无法忽略用户体验的问题,即使可以寻找平衡方案,但是和传统广告相比,依然是一个抑制广告规模的行为,因为在AI搜索下的广告模式会存在如下几个特点:

平台会优先推荐更加权威和优质的广告,对于质量不足的广告,难以得到优先的曝光,这个和之前竞价广告的机制不同;为了确保优先提供主流的观点,回答结果中广告的排序会相对靠后,因此广告的规模自然难以提上去;

面对这些问题,可能有哪些提升广告规模的手段,个人的观点如下:

通过提升用户的搜索留存,增加搜索的频率:虽然单次搜索的广告曝光概率下降,但是通过提升搜索的次数,可能能够弥补这部分损失,并且显然可以看到的是,AI搜索产品之下,用户的搜索频率相比传统搜索引擎是可以明显提升的;从CPC逐渐向CPS和CPA转变,提升广告单价:传统的广告主要依靠CPC,而AI搜索广告更加适合CPS和CPA,按照完成转化来付费;

5.为什么目前AI搜索还没有在商业上对传统搜索产生威胁?

前面虽然我们讨论了那么多AI搜索对传统搜索的商业的影响,但是目前上看,这个事情并没有在谷歌、百度等主流的搜索引擎中发生,或者说还不至于成为一个很严峻的问题,个人认为主要的原因还是因为AI搜索目前在搜索场景上还无法完全替代传统搜索,目前依然有大量的场景还是发生在传统搜索,比如:

AI搜索目前解决信息意图的检索需求,而商业意图的检索还是发生在传统搜索:根据a16z平台的分析指出,Google之所以能成为万亿市值的公司,是因为它捕获了用户带有“商业意图”的查询(如“最好的吸尘器推荐”),而维基百科之所以是非营利组织,是因为它处理的是“信息意图”的查询。而AI首先取代的是“无商业价值”的查询,他们认为,AI目前首先替代的是那些纯信息类查询,这部分查询对谷歌的广告收入影响不大。真正的决战在于,AI何时能更好地处理那些高价值的商业查询。网站等链接的检索场景,依然是大头,而这些目前依然还是通过传统搜索引擎更好,AI搜索更适合收集有信息量的内容载体并给出答案,这些内容载体大部分并不是网站这些;从模态上看,视频、图像、音乐等多模态的检索,依然还是发生在传统搜索,而不是AI搜索;

尽管AI搜索目前还存在如上的诸多局限,但是相信AI搜索逐步替代传统搜索会是大势所趋,因此以上我们讨论的问题,更多的是站在当下看未来。

三、AI搜索赛道调研分析

3.1 AI搜索目前的赛道划分和玩家布局

如果对目前的AI搜索领域做一个赛道划分,个人认为可以划分成7个赛道,其中包括:

传统搜索引擎+AI搜索:该领域的核心玩家主要就是几个传统搜索引擎的玩家,包括海外的谷歌搜索、Bing搜索,以及国内的百度搜索,这几个目前都是在传统搜索占据较高的市场,因为在AI搜索服务的普及和市场渗透上更加有优势;ChatAI助手类产品的AI搜索能力:该领域的产品没有将AI搜索作为一个独立的产品,而是将AI搜索作为其核心的基础能力,但依然是用户最常使用的AI搜索服务之一,其中包括海外的chatgpt、gemini等产品,以及国内的DS、豆包、元宝、kimi等产品;原生AI搜索应用:该类产品为纯原生的AI搜索产品,以AI搜索服务为垂直应用提供AI搜索产品能力,该领域目前玩家相对少一些,海外主要的玩家是Perplexity.ai,目前已经是一个月活千万级别AI,估值达到数十亿美元;国内知名的产品是秘塔搜索;操作系统级别AI搜索:该领域同样是将AI搜索服务作为操作系统层级AI的基础服务,其中包括微软copilot、苹果AI助手AppleIntelligence,以及国内各个手机厂商的AI助手;浏览器原生AI搜索:该领域大部分的产品形态主要为传统浏览器产品,浏览器和搜索引擎本来就是天生搭档,因此也是AI搜索的绝配,目前海外知名的包括Arc浏览器,这是一个将搜索和AIAgent结合,实现工作流自动规划和执行的AI产品;国内目前在浏览器中增加AI搜索服务的主要包括夸克、360AI搜索;内容平台AI搜索:该领域主要为传统的内容社交平台结合AI搜索服务提供内容搜索问答服务,主要玩家包括微信AI搜索、知乎直达、抖音AI搜索、小红书AI搜索;垂直领域AI搜索:即在垂直专业领域提供AI搜索服务,包括金融、电商、医疗、编程、旅游等,该领域目前没有太明显的巨头玩家出现,均为一些垂直领域的小产品为主;

3.2 各赛道玩家的竞争策略是什么样的?

接下来我们重点分析一下目前该赛道各个玩家,在AI搜索产品的战略定位和差异化竞争策略是什么样的?如下表格个人认为各个主要玩家的定位和竞争策略思考,概括起来,我觉得有如下几个特点:

传统巨头的战略分化:“生态防御”成为共同底色,竞争的本质,已从“谁的搜索结果更好”,演变为“谁能更好地利用AI加固自己的生态护城河”。

谷歌与百度的战略定位高度相似,其首要任务是捍卫其庞大的广告业务,避免因AI带来的“零点击”趋势而导致商业模式崩塌。它们的AI搜索产品,本质上是在不颠覆自身的前提下,对现有服务的“AI增强”,核心是稳住大众市场的默认入口地位。并在生态竞争、个性化搜索服务上体现差异化竞争,以谷歌为例。微软必应则采取了更具进攻性的非对称策略。它的目标并非在搜索广告上与谷歌正面对决,而是将AI搜索作为“特洛伊木-马”,其真正的战略价值在于为Windows和Office365这一更高价值的企业生态引流和赋能。如表格中分析,其“企业生态和私域数据搜索”能力,是其最独特的差异化武器。

AI搜索成为配套基础能力,依托封闭生态构建竞争壁垒

操作系统层(微软、苹果、华为)将搜索能力融入系统的每一个角落,使其成为AI助理的基础能力,核心是打通设备和应用,实现跨场景协同,并依托操作系统的封闭优势,构建竞争优势;内容平台(微信、抖音、小红书)则在自己的“围墙花园”内,利用独有的高质量UGC内容,构建了生活、消费、知识的“决策搜索引擎”,有效地将用户留在自己的生态内,封闭且独有的内容,是其做AI搜索的竞争优势;浏览器原生AI(Arc、夸克):则将搜索融入“浏览-思考-创造”的工作流中,让搜索服务于过程,而非终点。

AI搜索差异化竞争的核心要素:从“索引能力”到“独特数据与模型能力”

过去,搜索引擎的壁垒在于谁能最快、最全地索引开放的公共互联网。如今,竞争的核心要素已经转移。独特数据成为新护城河:无论是Gemini对用户个人数据(邮件、日历)的整合,微软Copilot对企业私域数据的打通,还是微信、抖音对平台UGC内容的利用,都证明了“独家数据”是构建差异化体验的根本。模型与技术专长定义了新的可能性:ChatGPT以其卓越的模型能力定义了问答质量的天花板;Kimi则凭借“长文本”这一单点技术突破,在深度研究领域开辟了新战场;GitHubCopilot在代码领域的成功,更是将“专业”二字推向了极致。

原生AI搜索产品,以无广告的搜索服务为卖点,挑战传统搜索引擎Perplexity.ai秘塔搜索为代表的原生AI搜索应用,其战略定位——无广告的“答案引擎”——直接对传统搜索引擎的商业模式发起了挑战。

3.3 AI搜索产品可以在哪些领域构建护城河?

结合前面关于各个核心玩家的竞争战略的分析,目前在众多玩家都在布局AI搜索的情况下,AI搜索类的产品,构建护城河的方向主要包括如下几点:

索引数据的护城河,其中包括如下几种场景:

私域数据:以操作系统等为主的私域数据,包括手机厂商和云服务厂商等,为超强竞争的能力,该竞争点难以被撼动;独家内容:微信生态的内容资源、小红书的笔记资源、抖音生态的短视频资源等,均为这些玩家独家的资源,依托这些独家资源,可以构建自身的竞争壁垒;权威智库和数据:也就是拥有超越普通UGC内容的权威数据和智库的厂商,在专业领域难以被替代的竞争力;

以生态为护城河,该场景或许产品能力不需要是最强的,但是厂商拥有生态的优势

以谷歌和微软的生态为例,分别占据个人服务生态和企业服务生态的优势;以微信生态未来,小程序这个应用程序的使用入口,也是其生态优势;

模型能力,也是AI搜索服务的关键竞争壁垒

以OpenAI为例,在搜索引擎的能力方面可能比较难超越,但是依托其强大的模型能力,在有限检索的情况下,依然能够给出高质量的回答;

产品能力,这个主要是在产品交互体验、生成结果质量等方面做差异化,比如:支持更多模态的搜索能力

以Arc浏览器产品为例,构建了检索→浏览→创作的闭环体验,直接帮助用户完成检索之后的任务执行,让整个AI搜索服务的用户体验更好;

输出更加符合用户最终想要的回答结果的内容,比如在回答结果的结构和范式上更加贴合检索场景,或者支持文本、图片、文档、链接等多种形式的组合等;

四、AI搜索核心产品分析

4.1 如何评价分析一个AI搜索产品的能力?

个人认为,评估一个AI搜搜产品的能力表现主要通过如下3个维度重点评估:

核心搜索与生成能力产品体验与交互设计信任、安全与责任

以下,我们针对不同的维度,详细展开具体的评估项目、关注点以及测试case。

1.核心搜索与生成能力

评估搜索引擎的能力以及生成结果,这个是AI搜索服务的内核,是产品的“硬件”性能

2.产品体验与交互设计

评估是否围绕用户体验提供更好的产品体验,让用户感觉到产品很强,有时候即使你第一点很强,但是产品体验做的很糟糕,反而用户很难察觉出来你背后技术的强大,反而一些底层技术一般的产品,在视觉和产品层面上做一些优化,用户反而感觉良好,产品和体验设计也是产品竞争的核心部分。

3.信任、安全与责任

生成结果的真实性、可靠性以及安全风险可控性,也是AI搜索产品很重要的因素,最终决定了生成结果可不可用。

4.2 核心玩家的产品能力对比如何?

基于以上针对AI搜索产品的评估维度,个人分享一下使用的比较多的几个AI搜索产品的评价,由于还没有时间做非常系统的测评,只是结合个人平时使用时的产品表现,发表一些观点,仅供参考。

1.Gemini

最近用的最多的还是Gemini 搭配2.5 Pro模型,因为个人平时需要生成一些相对更加专业的内容,所以对模型能力和输出结果的要求比较高。整体而言,Gemini 2.5 Pro给我的表现是相当不错的,基本满足了我85%以上的诉求,我对其评价主要包括如下几点:

比较认可的表现

在意图理解、信息检索能力、生成结果的专业度和逻辑性等方面综合表现都还不错;多模态理解的能力很强大,能够很精准的识别图片和上传文档的内容,这点非常重要,比如我经常需要上传参考图片生成相应的网页或者图片,以及需要解决文档阅读的问题,这两个场景非常依赖多模态理解的能力,而Gemini基本能够很好的满足我;

有待提升的表现

首先还是在于真实性和可靠性的问题,目前Gemini的回答结果,没有提供溯源的入口,因此对于生成一些对于时效性要求比较高,对数据准确性要求比较高的场景,并不太适合,比如搜索某只股票最近一周的股价,其回答结果可能是错的,并且并没有提供校验的入口;记忆能力方面,有时候对话轮次较多,单次生成内容太长的时候,容易出现遗忘的情况;生成结果不太稳定,生成质量有的时候很好,有的时候又会降智;

2.ChatGPT

毫无疑问的是,ChatGPT依然是目前众多的AI搜索产品里面综合能力最好的一款工具,也是我以及身边很多需要用AI解决一些专业且严肃场景工作的第一选择,个人的评价如下:

比较认可的表现

底层模型能力强大:依托与其模型的能力本身的强大,在输出结果的专业性、逻辑性等方面都无可挑剔,回答结果经常也比较富有创造性;稳定且响应效率高:另一个很重要的点是生成结果比较稳定,比较少出现Gemini时好时坏的情况,并且现在响应的效率也比较高;提供溯源等能力:回答结果上显示索引来源,对内容的真实性和可靠性有更高的保障;

有待提升的表现

唯一的局限就是收费比较贵,目前如果想要获得比较好的结果,还是得买plus的会员,但是每个月20美元的定价还是太贵了,只能偶尔有更加重要的事情的时候花钱使用几个月,而Gemini提供学生优惠套餐的做法造福了很多用户免费使用其付费版本。

3.豆包和元宝

现在一般在遇到一些需要快问快答,并且基于事实,有标准答案的问题的时候,我会倾向于快速使用豆包和元宝,其中豆包的优先级更高,最主要的原因就是这两个产品的响应速度快,并且时效性也不错,基本可以获得很快速的满足。

目前相对不足的,一方面是搜索结果的权威性和专业度还没有体现出来,基本都是检索一些内容比较浅、深度不够的内容为主,而专业类的研报、论文等还不行;其次就是因为模型的能力还有限,所以回答结果的深度也不太够。

4.秘塔搜索

这款AI搜索产品,目前经常被我用户检索和下载研究报告,对我来说,这款产品比较有吸引力的点在于其搜索结果的权威性、专业度和数据来源的质量更高,并且可以支持将报告下载到本地,所以我经常拿这个产品来搜索一些研究报告并下载到本地,然后用更强大的模型来运行这些资料,至于其生成的答案则更多的是快速过一眼,但采纳和使用率并不高。

五、AI搜索领域的技术调研

5.1 企业如何支持联网检索能力?

从一个创业者的角度看,如果你想要让自己的产品拥有联网检索的能力,可以通过如下4种方式实现:

方式1:通过搜索引擎API的方式支持检索能力

该方式可以通过主流的搜索引擎API直接支持,这个方式最大的优势就是成本比较低,以谷歌搜索提供的API为例,其定价大概是每1000次5美元,并且搜索的时效性和覆盖度比较高,但是也存在如下的局限:

控制力极弱:你无法控制搜索结果的排序、质量和更新频率,完全依赖于上游搜索引擎。结果质量不稳定:返回的是链接列表,可能包含大量低质量或不相关的PDF,需要用户自行筛选。能力单一:只能“找到”链接,无法“理解”内容。如果想做摘要或问答,需要额外增加LLM处理步骤,增加了复杂性和成本。品牌天花板低:产品的核心能力完全建立在第三方之上,难以构建自己的技术壁垒和品牌护城河。

目前行业内几个主要的搜索引擎API的定价和优劣对比如下:

方式2:利用LLM的工具调用能力获得搜索结果

该方案的原理是利用GPT-4o等具备工具调用能力的大模型调用搜索引擎,获取检索结果,这个方式的好处,一方面在于便捷,可以直接通过大模型调用各种搜索引擎,不用一个一个的接入各种搜索API,另外一方面在于自己可以给模型定义检索规则甚至排序的逻辑等,存在更多的定制空间,也是目前个人比较推荐的方式,但也存在一定的局限性如下:

过程不可控(黑盒效应):提交检索后,大模型调用搜索引擎检索的过程是一个黑盒,你无法控制中间的检索行为,也不知道发生了什么;高度依赖模型能力:最终效果的好坏,完全取决于你所使用的LLM(如GPT-4o,Claude3Opus)的“智商”和其工具调用能力的成熟度。成本难预测:该方式下的成本结构包括2部分,一部分是搜索调用次数的成本,比如GPT-4o的调用成本是20美元/1000次调用;另外一部分是token的消耗成本,按照模型生成的问答结果的token计算;由于AI的自主性,一次看似简单的用户提问,可能会触发多次工具调用和大量的思考Token,可能导致单次成本飙升。

对比各个模型厂商的定价如下:

方式3:自建爬虫与索引库 (RAG)

该方式为工作量最重的方式,企业自己构建自己的索引库,该方式依赖爬虫技术,成本也比较高,周期比较长,但是相应的好处就是完全具备索引内容的控制权,并且可以将索引库构建成为自己的竞争力。

方式4:直接使用AI搜索产品开放的API获取问答结果,比如Perplexity API

该方式相当于直接接入行业内做的比较好的AI搜索产品开放的API,获取他们的回答结果,优势在于省事,可以直接获得经过处理的回答结果,而不是一堆的链接,可以跳过中间对于检索结果的处理和内容的获取等问题,但是也存在一些局限:

对于生成环节缺乏可控性:问答结果的生成由API提供方控制,自身难以做个性化的设计;API提供方的问答结果质量决定了你的产品能力上限,你很难超越他们。数据隐私顾虑:用户的查询数据需要发送给第三方处理,相当于API提供方获取了你的数据;成本比较高:该方式的成本结构包括2部分,一部分按调用次数收费,另外一部分按照token消耗收费,如果你需要生成的内容比较多的情况下,成本是比较高的,可能远超前面的几种方式;

对于以上的方案的选型,企业可以综合结合经营目标、成本和迭代速度的情况,灵活选择,并且企业也不一定在以上4种方式中选择一种,也可以同时支持多种方案,比如可以既自建索引库,同时也使用搜索引擎API。

5.2 “深度搜索”技术方案调研

1.什么是深度搜索?

深度搜索是继RGA的搜索解决方案之后提出的另一种更强大的搜索技术能力,在开始理解如何支持深度搜索能力之前,我们先理解一下RAG和深度搜索两种技术方案的区别。

1)RAG及其局限性

RAG(增强检索生成)是去年比较火的概念,因为大模型不具备实时联网的能力,所以在问答的时候需要通过搜索引擎来检索实时的信息,所以RAG成为了一种通用AI产品的标配,RAG的原理很简单,就是大模型在执行回答的时候,先检索与用户输入的提示词相关的信息,然后阅读检索的内容,最后针对问题做出回答,整个过程中,只执行一次检索,然后直接做出回答;

RAG的局限性就是比较依赖搜索引擎和检索数据源,想要一次性就准确并且完整的检索到回答用户问题需要的参考信息难度比较大,很容易出现检索数据缺漏,或者检索结果质量深度不够的问题,比较适合快搜索以及简单问答场景;

2)Deep Search是什么?

Deep Search则是在在 RAG 基础上引入多步迭代机制,通过「搜索→阅读→推理→再搜索」的循环流程持续的检索,直到满足某一业务设定的条件才终止,最终最大限度的获得更好的结果。

这个过程中,用户输入提示词之后,系统会初步检索,并阅读检索的结果,然后推理判断目前的检索结果是否足以很好的回答当前的问题,比如如果分析发现依然存在信息缺口后触发二次检索,直至满足预设终止条件(比如token 预算耗尽或答案结果的置信度达标)。比如近期豆包上线的深度搜索的功能,能支持“边想边搜”的功能,本质其实就是这样的一个过程;

这种设计方式,构建了一个机制,让系统能够尽可能更多的去检索更多的结果,并且在检索的过程中能够及时的发现存在的问题,并进一步努力优化,从而可以显著提升检索结果的丰富度和准确度,并且提升回答结果的准确度、完整性等。但是可想而知的是,这个方式,必然导致的是检索和响应问答的时间会延长,问答的成本会提高很多。综上可以看到,深度搜索的回答结果相比RAG的回答结果会更加专业、系统和深入,同时也是一种实现成本更高的方式,接下来我们来看一下,如果对于创业公司想要支持深度搜索能力,目前有哪些现成的解决方案,因为自研的路径是更加复杂且代价昂贵的解决方案,创业公司很难自研这样一套能力。

2.企业如何支持 “深度搜索”能力?

这里主要分享2种支持该能力的方式,一种是使用商业闭源的解决方案,也就是购买使用现有的厂商提供的深度搜索服务,另外一种是采用开源的解决方案;

1)商业闭源方案

阿里云:OpenSearchOpenSearch是阿里云对外售卖提供的深度搜索的服务,接入该服务可以支持深度搜索的能力,详细的情况可以阅读如下链接:https://www.alibabacloud.com/help/zh/open-search/llm-intelligent-q-a-version/deep-search-practice-tutorial; 其计费的方式具体如下,本质上是通过租赁计算资源和存储资源的方式收费,说实话定价比较贵,对于创业公司来说可能并不太合适;

Jina.AI : 深度搜索API 海外产品中目前提供深度搜索API的产品主要有Jina对外售卖的深度搜索API,详细情况可查看其官网,https://jina.ai/zh-TW/deepsearch/,目前官网上没有直接公开定价信息。

2)开源方案:OpenSearchOpenSearch是一个功能强大、完全开源的分布式搜索与分析引擎,它将顶级的“关键词搜索”与“AI向量搜索”融为一体,该开源方案也是目前使用较多的深度搜索开源项目。

5.3 “深度研究(DeepResearch)”技术方案调研?

深度研究是比深度搜索更加进阶和复杂的技术方案,目前也基本代表了AI搜索领域最专业的搜索技术,以下分享深度研究的商用和开源解决方案;

1.Deep ReSearch是什么?

Deep Research和Deep Search的区别在于,Deep Research模式之下,系统会在回答用户的问题的时候,会先构建一个系统的提纲,然后在回答每一级提纲的内容的时候,都走一遍Deep Search的流程,假如有100个大纲,则需要执行100次Deep Search的过程;因此Deep Research模式下可以生成非常长、且有深度的内容,达到超长的研究报告的水平。

2.深度研究的开源和商用技术方案

1)商用模型

目前商用模型中,直接围绕着深度研究的领域开放相应的大模型API的主要是OpenAI的o3-deep-research系列的模型,该模型支持直接调用API支持深度研究,但是定价比较昂贵,输入10美元/百万token,输出40美元/百万token;

2)开源项目

JinaAInode-DeepResearch:这是一个开源的deepresearch产品,代码完全公开在githubhttps://github.com/jina-ai/node-DeepResearch,基础模型基于开源模型(如DeepSeek-R1等),支持切换openai等其他模型,也支持支持本地部署和二次开发。GPTResearcher:这是一个专门为深度研究设计的、相对轻量级的开源项目。用户只需输入一个研究课题,它会自动进行多源信息搜集、过滤无关信息、整理并生成带引用的研究报告。它旨在复刻类似Perplexity或o3-deep-research的核心体验,并且易于部署。Deerflow:这个开源项目是字节对外开源的深度研究的项目,该项目基于LangStack方案设计,Github项目仓库:https://github.com/bytedance/deer-flow,目前官方推荐搭配豆包1.5Pro来运行DeerFlow。六、AI搜索未来的前沿思考

最后部分,分享一下对未来AI搜索产品的一些思考,严格意义上讲,目前的AI搜索产品,其实还是基于传统的搜索引擎,补充结合大模型的生成能力,让一部分搜索场景的使用体验更好,但是依然没有实现超出传统搜索引擎太多的体验,个人觉得,从产品形态上看,在AI搜索领域未来可能存在如下的发展趋势。

1. 弱化提问者的依赖,从“被动应答”到“主动预判”

现有的AI搜索产品无论多智能,目前本质上仍是“一问一答”的被动模式,也就是说还是依赖用户自己能意识到通过AI产品来完整搜索场景的任务,并且AI搜索产品也做到用户问什么,它就答什么;

而更加超前的AI搜索产品未来可能能做到实时、低功耗地感知用户的个人情境(通过日历、邮件、位置、健康数据、甚至实时环境),即使用户不开口,产品也能主动为你提供用户可能需要的“搜索结果”或“解决方案”。比如产品能关注到我最近高频的检索”AI搜索“的内容,它能在空闲时段自主规划和组织针对AI搜索的资料检索、学习计划、热点追踪等,并将内容推送给我。

2. 从只是提供搜索答案,到规划执行

现有的AI搜索结果,只能是给你模型汇总的结果,但是对于结果中的行动和任务,尚不能自主的完成,而更完美的结果是在获得检索结果之后,代替用户执行任务;比如帮我从小红书等平台中搜索东欧的主流玩法,并完成旅行规划的制定和酒旅预约等。

从技术的层面上看,AI搜索产品不仅仅是”大模型+搜索引擎”技术的结合,更是一个集合基于、规划、反思、工具使用的Agentic AI框架。

3. 从文本搜索框,到多模态交互

未来的AI搜索产品还将从文本搜索框,到支持多模态、多设备、多搜索场景的交互方式;用户不仅基于电脑和手机设备的文本输入框触发搜索,还可以基于语音、图片、摄像头实时环境信息等触发检索;也可以通过手机和电脑设备之外的智能设备触发检索,包括AI眼镜、AI耳机等AI硬件智能终端等。

4. 从公域知识检索,到私域数据检索

当下的绝大部分AI搜索产品,基本都是基于公域互联网信息的检索产品,未来AI搜索将更多的结合个人和企业私域和“本地”的做检索服务,并结合用户的个性化信息提供更精准的搜索结果。

来源:人人都是产品经理

相关推荐