摘要:Deep Research是OpenAI近期在ChatGPT中推出的一种新型智能代理功能,能够自主在互联网上执行多步骤的深度搜索和分析。简单来说,用户只需提出复杂研究任务的请求,Deep Research 会像一个资深研究分析师一样,为用户查找、阅读和综合数以
说明:此为为万维钢通过OpenAI的Deep Research生成的关于Deep Research自己的调研报告。一起感受一下最新的OpenAI的进展。
Deep Research是OpenAI近期在ChatGPT中推出的一种新型智能代理功能,能够自主在互联网上执行多步骤的深度搜索和分析。简单来说,用户只需提出复杂研究任务的请求,Deep Research 会像一个资深研究分析师一样,为用户查找、阅读和综合数以百计的在线资料,最终在几十分钟内产出一份全面的报告。这一过程通常需要人工花费数小时甚至数天,而Deep Research宣称可在10分钟内完成相当于人类“数小时”的研究工作。它的强大之处在于多步骤推理和工具调用:Deep Research由OpenAI即将发布的o3推理模型驱动,针对浏览和数据分析进行了优化。通过端到端强化学习训练,该代理学会了规划并执行搜索路线,根据实时检索到的信息不断调整策略并回溯修正,从而完成复杂的研究任务。在执行过程中,Deep Research会自主调用多种工具:包括浏览器访问网页、解析网页中的文本内容,还能读取图像和PDF等文件;必要时也会运行Python代码对数据进行处理,这也是其训练中引入的能力。这种多模态能力意味着它不仅能检索文字,还可以“看”网页上的可视化信息甚至图片,以提取有用内容。整个检索分析过程对用户是透明的:在界面侧栏中,ChatGPT会动态展示Deep Research的思考链和操作步骤,包括它正在用的搜索查询、打开了哪些来源、以及推理过程摘要等。等到研究完成,用户将得到一份条理清晰的报告,其中包含了问题的详尽解答、引用出处以及AI自身的思路解释。值得一提的是,Deep Research目前仅向ChatGPT Pro用户开放(每月收费200美元),每月限制100次查询。官方表示由于Deep Research的推理过程计算量巨大,未来会推出较小模型以降低成本,并逐步开放给Plus普通付费用户。
与传统搜索的区别:Deep Research与我们日常使用的搜索引擎有本质区别。传统搜索(如Google)主要根据关键词返回网页列表,用户需要自行点击阅读并整合信息。而Deep Research则跳过了人工筛选阅读的步骤,直接由AI代劳完成资料研读和综合。这标志着信息检索范式从“简单搜索”进入了“深度搜索”时代——不再仅仅是找到信息,而是对信息进行分析和提炼。举例来说,如果在普通搜索引擎查询某学术问题,往往会得到一堆链接,需要人工逐一查证;但使用Deep Research,AI会主动在众多来源中深入爬取并归纳,给出像综述论文一样的答案。官方将此视为向通用人工智能(AGI)迈进的重要一步,因为综合已有知识是创造新知识的前提。此外,Deep Research生成的报告会附带清晰的引文和来源,使用户可以追溯验证。这一点也不同于普通搜索结果仅提供链接,或者一般聊天机器人给出回答却缺乏来源依据。总的来说,Deep Research相当于把传统搜索、阅读、笔记整理等环节用AI流水线式地串联起来,极大提高了效率。
与 Perplexity AI 等对话式搜索的区别:在Deep Research推出之前,已经有像Perplexity等基于大模型的搜索助手。Perplexity通过语言模型快速总结搜索结果,为用户提供简短回答。然而,与Deep Research相比,这类工具侧重即时的简要答复,处理过程通常只是一次查询和结果摘要,深度不足。根据测评,Perplexity更像是一个高级版的问答搜索,能够给出一句话或一段话的快速回答,但往往为了速度牺牲了深入性。它倾向于逐条回答用户问题,缺少长程的上下文记忆和多轮推理,这使得对复杂议题的讨论可能变得片段化。Deep Research则擅长大范围爬网和长链路推理,在理解上下文和连贯对话方面表现更好:它会根据需要连续提问澄清需求,并能长时间“记住”讨论背景,自主决定下一步往哪里找答案。另外,Deep Research可以获取最新的实时信息,对突发新闻或变化迅速的领域提供最新洞见(Perplexity虽然也可联网,但深度和广度有限)。在用户体验上,Deep Research更偏向互动式研究助手:它会不断学习用户反馈,改进检索策略,从而提供更个性化的结果。Perplexity则定位为快速答案提供者,缺乏这种自适应学习和深入分析的能力。一句话总结:Perplexity擅长快速准确地回答简单问题,而Deep Research擅长全面透彻地调查复杂课题。对于需要全面论证、权衡利弊的问题,Deep Research能够展示更强的推理和论证能力,例如列举正反两方面观点,这些都是Perplexity等简报式搜索所不及的。
与 Google “Deep Research”的区别:巧合的是,Google方面据称也有一个与之同名的内部项目或功能。OpenAI发布Deep Research时,一些谷歌员工表示不满,认为OpenAI不仅在名称上撞车(都叫“Deep Research”),连技术思路也类似。实际上,Google早些时候在2023年末曾推出过依托Gemini模型的“深度搜索”功能,据报道也使用了“Deep Research”这个名称。然而,两者在能力上存在明显差异。谷歌的版本被指出使用的是Gemini 1.5 Pro模型,这是一款相对普通的LLM,对推理和多步骤任务的优化不足。有用户将Google的输出与OpenAI的进行对比,形容谷歌Deep Research生成的内容就像“为了SEO拼凑的网页文章”,而OpenAI Deep Research的输出更像是“一个聪明大学生写的文献综述”——在质量和深度上判若云泥。Casey Newton在实测中也发现,Google版的Deep Research虽然能用LLM回答搜索类提问,在帮助分析问题上“中规中矩”,但OpenAI的版本“完全把它甩在身后”,因为后者不仅回答更长更详尽,且逻辑性更强。当然,这也与计算投入成正比:OpenAI Deep Research目前定价高昂、使用门槛更高——正如有评论调侃的,“毕竟这是一个价格高出10倍的产品”。总的来说,OpenAI的Deep Research采用了专门强化过推理能力的模型,在自主研究深度和分析品质上领先于Google的同类尝试。不过可以预见,随着竞争加剧,谷歌等公司也会迅速升级各自的“深度搜索”AI。正如有评论所言,Deep Research的发布加剧了AI情报检索领域的竞争,迫使Google等加速创新,否则其长期垄断的搜索地位将受到冲击。
自Deep Research推出以来,在科技媒体、研究学者、企业家以及广大普通用户中引发了热烈讨论。从社交媒体到专业论坛,各路反馈纷至沓来。我们调研了这些第一手评价,现将用户体验的主要观点归纳如下:
许多科技记者和AI专家在试用Deep Research后给出了深刻评价。Platformer科技通讯的作者Casey Newton将其称为**“可能是首个真正好用的AI代理”,认为尽管它仍会犯错,但凭借惊人的速度和高质量的平均分析水平,已代表了AI能力的显著飞跃。他指出Deep Research在综合分析**方面的表现令人印象深刻,能够在短时间内产出接近人类分析师水准的报告,这预示着即便以当前技术来看,这类工具也足以大幅加速研究、分析、论证等知识工作。一些研究人员对该工具表现出兴奋态度。例如,有科研背景的用户表示:“作为一名研究生,这项功能太令人振奋了,它将把科研的速度提升到全新的层次”。他们期待借助Deep Research快速完成文献调研等繁琐工作,从而将更多时间投入创造性思考。
与此同时,也有专家对其局限性保持审慎。OpenAI官方提供的评估数据显示,Deep Research在名为“Humanity’s Last Exam”(人类终极考试)的综合测试中准确率为26.6%。这虽然远超一般模型(OpenAI较小模型成绩仅13%,某开源对手DeepSeek约10%),但绝对值并不算高。有评论据此指出:“这相当于一个研究助理给出的结果只有26%是对的、74%是错的,而且还像真的一样呈现出来——问题在于你无法轻易分辨其中正确与错误的部分”。因此,专家们强调Deep Research目前更多是辅助工具而非权威,在严肃场合不能不加审视地完全依赖。甚至有资深程序员在Hacker News发帖质疑:“我们不可能雇佣一个张口就瞎编东西的人,为何对AI工具就能网开一面?”他呼吁在提高可靠性之前,应谨慎将此类AI投入关键工作。这反映了专业圈对AI“幻觉”(hallucination,即捏造不实信息)问题的持续担忧。
在广大普通用户和开发者社区,对Deep Research的反馈可谓褒贬皆有。一方面,许多用户被它展示出的类AGI雏形震撼到。有网友兴奋地称:“Deep Research几乎就是目前公众能用到的最接近AGI的东西”——在一些真实任务中,它表现出近似通用智能的能力。尤其是看到AI可以自主连贯地执行这么复杂的研究流程,不少人感到既惊喜又受激励,仿佛未来已经到来。有Reddit用户表示,Deep Research提供的分步思考过程让人印象深刻,“主观上看,真的很像一个聪明的人在逐阶段总结他们的研究”。当它最终给出报告时,很多人发现行文流畅且逻辑清晰,仿佛AI真正“读懂”并联系了多篇资料,达到了前所未有的理解深度。一位试用者把OpenAI Deep Research输出的报告与Google版做了比较,直言“OpenAI的版本更好,完全不在一个档次”。他用自己的比喻强调两者区别:OpenAI写出的像高质量文献综述,而Google的更像东拼西凑的网络文章。这样的反馈代表了相当一部分用户对Deep Research优点的评价:内容深入、有条理且引用翔实,已经超出一般AI问答的水平。
另一方面,用户也提出了不少不足和槽点。首当其冲的是错误与幻觉问题。许多人在试用过程中发现Deep Research有时会产出似是而非的信息。比如一位开发者让AI编写关于他本人的报告,在短短500字中就发现至少三处错误:AI误把他在Stack Overflow上“被多少人浏览过”的数字当成声望值引用,还把他提问帖中他人的回答当作他的专业见解,甚至混淆了他和他兄弟接受采访的身份。这些乌龙让用户哭笑不得,也提醒大家AI的结果需谨慎对待。这位用户由衷建议:“把它当作启发灵感的起点还行,但一定要对输出保持警惕,点进引用的链接核实每一条信息”。核查后发现,很多时候并非AI胡编,而是它误读或误用了来源——例如上例中AI引用了正确的链接但错误解读了页面数据。这说明Deep Research在理解复杂网页内容时仍可能出错,需要人工复核。除了细节谬误,一些用户还担心Deep Research在某些领域会遗漏重要信息。由于它主要能访问公开的网络内容,对于付费墙后或未数字化的资料可能无能为力。正如一位用户指出的,很多有价值的数据“藏”在教科书、私有数据库或纸质文件中,AI目前触及不到。因此Deep Research擅长的是广度覆盖网络公开资料,但对深度专业领域的封闭信息仍然有局限。还有用户反馈了速度和费用的问题:Deep Research单次检索耗时5-30分钟不等,远没有即时搜索来得快。这段时间里AI虽然自动工作,但用户需要等待结果。此外高昂的订阅费用(Pro版$200/月)和查询次数限制也令普通用户望而却步,有网友调侃“我们这些小老百姓充Plus的钱可能都用来给Pro用户供电了”。不少Plus用户抱怨自己暂时用不上Deep Research,只能看别人演示干着急。不过OpenAI已经承诺会在安全测试通过后约一个月内向Plus用户开放这项功能。
综合来看,人们对Deep Research的优点和缺点都有着清晰认知:它代表了AI自动化研究的巨大进步,令人惊喜于其效率和洞察力,但同时也存在着可靠性、速度和可及性方面的现实局限。正如一位用户总结的那样,目前将它定位为**“研究起点”或“助理”是比较稳妥的做法——让AI先快速扫荡信息形成初稿,然后由人来审查和完善**,才能取长补短,发挥最大价值。
尽管Deep Research尚处于早期测试阶段,但已经涌现出不少引人注目的使用案例,展示了它在各种场景中的有效运用。这些案例既有OpenAI官方提供的示范,也有用户实际尝试的反馈,涵盖从数据分析到创意问答的多种类型:
全球移动操作系统普及率分析:一位用户让Deep Research调查“过去10年中GDP排名前10的发达国家和前10的发展中国家的 iOS 和 Android 智能手机普及率”,并要求将结果绘制成表格。Deep Research据此自动检索了各国智能手机市场的数据报告和统计资料,将十多年来不同国家iOS/Android的使用比例进行整理比较,最终生成了一张清晰的数据表格,帮助用户一目了然地看到发达与发展中国家在移动操作系统上的差异趋势。这种跨多个数据源、长时间跨度的比较分析,传统上需要人工耗费大量时间搜集整理,而Deep Research几乎全程自动完成。影视片段识别与信息整合:Deep Research具备多模态分析能力,能处理文字以外的信息。有人提供了三个电视剧的片段给AI(可能通过提供描述或截图),要求它识别这些片段出自哪一集。Deep Research通过搜索剧情摘要、剧迷论坛等信息源进行比对,成功推断出对应的剧集名称。类似地,它还被请求统计“NFL(美国橄榄球联盟)踢球手的平均退役年龄”。AI于是搜索体育数据库和新闻,对历年NFL踢球手退役时的年龄进行汇总计算,给出了平均值并引用了相关数据来源。这两个例子展示了Deep Research处理非文本线索和数据统计任务的能力:前者涉及图像/视频内容的检索理解,后者则需要从多项数据中提取规律,均由AI自主完成。专业领域文献综述:在医学和科学研究方面,Deep Research也展现了强大的资料整合本领。例如有人请它调研当前治疗血友病的基因疗法,要求列出已获批准的疗法名称、开发公司、批准年份和所用的病毒载体技术。Deep Research检索了医药监管机构公告、科学文献和新闻稿等信息源,最终提供了一份详尽的清单,将几种主要基因疗法的名称、背后公司、批准时间以及技术路线一一列出,俨然一篇小型行业报告。又如在细胞重编程效率相关的研究上,Deep Research能够总结多篇学术论文关于蛋白质突变改良重编程的结果,找出哪些位点的突变提升了效率并分析其原因。这些案例说明,对于学术科研类的问题,Deep Research可以胜任文献综述的角色,在短时间内扫遍相关论文并提炼关键信息,节省研究人员的大量文献阅读工作。个性化决策支持:Deep Research不只是面向学术和专业领域,对于个人用户的一些重大决策也能提供帮助。例如,有滑雪爱好者求助AI:“根据我的偏好,帮我挑选一块完美的滑雪板”,并给出了所在地区的雪况、常去的地形类型、预算和个人风格喜好等条件。Deep Research随即搜索了滑雪板的评测和推荐文章,将不同品牌型号的特点与用户偏好相匹配,提供了具体的型号建议和理由说明,包括为何这些选项适合该用户的雪地和滑行风格。整个建议过程有理有据,让用户对购买决策胸有成竹。类似的,在汽车选购、电子产品对比等消费场景,Deep Research都可以发挥作用——例如它可以分析成千上万条汽车评测和用户评论,根据用户关心的指标(安全性、油耗、价格等)给出定制化的车型推荐。这些真实案例表明,Deep Research作为智能助手,能够理解复杂需求并综合多源信息,为个人和企业决策提供高质量的参考。无论是宏观的数据分析,还是微观的专业问题,抑或是日常的选择难题,Deep Research都已有成功的实践范例支撑其效用。要想充分利用Deep Research,让其成为您工作和学习中的得力助手,以下是一些使用策略和最佳实践,可帮助您发挥这项工具的最大价值:
精心构思查询,明确研究目标:Deep Research对输入的提示质量非常敏感。用户提供的请求越具体、背景信息越充分,AI越能理解任务并制定正确的搜索计划。理想情况下,您应像给研究助理下任务那样,清楚描述您想要解决的问题、需要涵盖的方面。如果问题较宽泛,Deep Research可能会首先向您提问以澄清需求。例如Casey Newton请求它解释Deep Research工作原理并比较Google同类产品时,AI主动询问了细节以便聚焦关键点。最佳做法是:在初始提问时提供尽可能多的上下文,让AI“心中有数”;若AI提出澄清问题,一定耐心作答,因为这有助于它校准方向。通过这样的互动,Deep Research能更精准地理解您的意图,从而制定更有效的检索策略。耐心等待过程,关注中间输出:Deep Research执行复杂查询可能需要几分钟到几十分钟不等。在此期间,您可以做别的工作,无需时时干预。但建议时不时查看侧栏,关注AI展示的实时思考链和搜索步骤。这不仅让您了解研究进展,也有助于及时发现跑题或卡壳的情况。一旦发现AI可能偏离主题,您可以通过对话窗口提示或纠正,引导它重新聚焦正轨。例如,若您注意到它检索的方向不符合预期,可以打断并澄清要求,避免浪费时间。在多数正常情况下,Deep Research会按照逻辑一步步完成,无需人为介入。但保持对过程的可见性,有助于用户对最终结果的信心和理解。同时要有耐心,切勿频繁中断或催促,因为过多的干预反而可能扰乱AI的自主规划。善用其长处,选择合适的任务:Deep Research适合那些信息分散、需要综合研判的问题。在这些任务上,它能远超一般搜索工具的效率和效果。例如,撰写行业趋势报告、比较复杂技术方案、调研学术课题等,都非常契合其能力。如果您是学生做论文研究,Deep Research可以快速产出初步的文献综述;如果您是咨询顾问,需要了解某新兴市场的概况,它能帮您网罗数据、整理洞见。然而,对于简单直截了当的问题(如单一事实查询、即时新闻查询),可能用不着大动干戈地调用Deep Research。毕竟它耗时较长,而且每月查询次数有限宝贵(Plus用户只有10次/月,Pro为100次)。最佳实践是:把Deep Research当作“重型工具”用于最棘手的深度问题,而将日常琐碎问答留给普通的ChatGPT或搜索引擎。这种分工能确保您以最小成本获得最大收益。正如有评论指出的,若是烹饪时查一个菜谱、问“摩尔多瓦的首都是哪”,用Perplexity那样的快问快答工具更方便;但若是要讨论一个开放性的伦理难题、比较A方案和B方案的优劣,Deep Research才能真正大展拳脚。核查来源,保持批判思维:尽管Deep Research会提供引用来源,但不要对AI输出毫不质疑地全盘接受。一定要点击并阅读它给出的参考资料,核实关键事实是否准确。正如一位早期用户的经验教训:它列举的数据看似有出处,但可能误用了来源中的信息,需要人来火眼金睛发现。养成交叉验证的习惯——对每条重要结论,都追溯其引用来源,确认无误后再采信。尤其在学术和商业决策领域,更应对AI报告进行人工审阅。如果发现错误或不确定之处,可以在对话中向AI提出异议或要求解释,它往往能根据来源进一步澄清。总体来说,要把Deep Research当作智能助手而非最终裁决者。人类的专业判断、常识校验对最终结果依然至关重要。OpenAI官方也明确提醒,当前Deep Research仍会出现幻觉和推断错误,因此专家的审核和把关不可或缺。发挥创意,拓展应用场景:Deep Research是一个通用性很强的工具,其潜力不仅局限于传统的文字研究。用户可以大胆尝试多样化的任务,例如让它分析数据集(通过提供文件让AI使用内置Python工具分析)、比较视觉资料(上传图片让它提取信息)、甚至跨语言翻译和文化研究等。在官方案例中,有人要求它将一种克里奥尔方言翻译成英文,同时解释翻译过程,这体现了其语言和知识迁移能力。您也可以尝试让Deep Research帮忙做一些专业领域之外的探索,例如艺术流派比较、历史事件梳理等。不少用户报告,当以开放性的探索心态使用Deep Research时,常有意想不到的收获——AI可能会从独特的角度整理资料,带来新颖见解。当然,务必在安全合理的范围内使用,不要让它去执行违反法律或道德的“研究”。总之,越充分利用其多模态和多步推理能力,Deep Research就越能为您挖掘出隐藏的信息宝藏,为各种应用场景提供助力。通过以上策略,用户可以将Deep Research融入自己的知识工作流,形成**“人机协作”**的新范式:让AI负责繁重的资料搜集与初步分析,人类负责审阅、判断和创造性决策。这样的组合能够最大程度发挥Deep Research的价值,又保证成果的可靠与高质。正如OpenAI所强调的,Deep Research并不能也不打算彻底取代人的作用——人类的智慧、创造力和批判性思维始终是不可或缺的。掌握好使用方法,我们就能让Deep Research成为延伸人类智力的强大工具,把知识工作的效率和深度提升到前所未有的高度。
OpenAI Deep Research的出现,引发了关于“知识的工业化”的热议。所谓知识工业化,指的是将以往高度依赖人工的知识生产过程,转变为大规模自动化、系统化的流程。Deep Research正是朝着这个方向迈出的一大步:它把信息采集-分析-整合这一知识工作流水线实现了高度自动化,在一定程度上实现了知识生产的“批量化”。过去,需要一个研究团队通力合作数天才能完成的资料调研任务,现在可能一个人借助AI在几小时内就能搞定。这无疑会对科研、咨询、写作、市场分析等典型的知识密集型行业带来深远影响。
首先,Deep Research预示着知识工作的效率革命。就像工业革命的机械设备极大提高了制造效率一样,知识工作者现在有了“AI机器助手”来极大加速信息处理。从业者可以在更短时间内产出更多高质量的分析报告。这将重塑行业竞争格局:能够熟练运用这类AI工具的个人和组织,将比仍依赖传统手工方式的同行具备显著优势。举例来说,在咨询行业,咨询顾问往往需要快速梳理某个陌生领域的大量资料以提出建议。有了Deep Research,咨询公司可以在很短时间内为客户准备详尽的研究报告。市场分析师也可以借助AI迅速跟踪全球动态,更新数据模型和市场洞察。这意味着那些以搜集整理公开信息为主要价值的岗位或公司,可能面临业务被侵蚀的风险——正如《The Information》报道所言,Deep Research这样的工具对任何“业务是通过搜罗互联网信息并加以整合”的公司构成了潜在威胁。一些传统行业(如信息咨询、调研代工等)的商业模式,可能会被AI重构甚至颠覆,因为客户完全可以直接让AI完成这些工作。
其次,Deep Research带来了知识生产方式的变革。以前,知识往往由专家或研究员通过人工调研形成,因此生产率受限于人力和时间。但现在,AI可以昼夜不停地爬网分析,让知识生产更接近工业化流水线,按需大规模产出。这会促成知识的快速迭代和更新。例如媒体行业,记者和编辑能够借助Deep Research在报道中快速核实背景、获取多角度资料,从而更快地产出深度报道。这会提升内容生产的速度和密度。然而,也有担忧指出,知识的同质化可能随之而来:如果大家都使用相同的AI工具检索信息,是否会趋向引用相同的来源、得出类似的结论,导致观点多样性下降?知识的工业化可能带来规模与独创性的权衡。一方面,知识产出像工厂一样高效了;但另一方面,如果人们过度依赖AI整理的信息,而不去亲自探索思考,创新洞见可能减少。这个问题在学术界尤其受到关注:当学生和研究者都用AI帮忙写综述,是否会出现千篇一律的论文解读?对此,专家们呼吁将Deep Research视作起点而非终点——人类仍需对AI整合的知识进行再创造和批判质疑,才能产生新知识,而非只是重复机器总结的二手内容。
对知识密集行业而言,Deep Research既是机遇也是挑战。一方面,它提高了知识工作的自动化程度,可能催生“知识工厂”式的新业态。例如咨询公司可以同时接更多项目,因为每个项目所需的基础研究可由AI快速完成;市场研究公司能够以更低成本提供报告,从而扩大业务规模。这种“知识流水线”甚至可能形成新的服务形态——一些创业者或企业可能专门基于Deep Research开发垂直领域的知识服务,为客户定制高效的信息分析。例如,有初创团队已经尝试用开源模型复现类似Deep Research的功能,一旦门槛降低,各行各业都可能出现“AI研究助理”工具。不过另一方面,现有行业的价值链将被重组。那些扮演信息搜集、汇编角色的中间商将被削弱,行业从业者需要提升自身定位,从简单的信息搬运工升级为有洞察力的分析师。因为当AI能提供原始资料和初步分析,人类专家的价值更多体现在对这些信息的解读、判断和战略决策上。知识的工业化不会抹杀人的作用,反而提高了对人提出更高层次能力的要求:创造力、批判性思维、道德判断等,这些是AI暂时无法完全取代的。
综上所述,Deep Research预示着知识行业将经历一场“生产力跃迁”。它让知识生产朝着标准化、自动化、大规模方向发展。这是否就是“知识的工业化”?在某种意义上,是的——知识的获取和整理部分正被机械化地批量生产。但值得注意的是,知识不同于物质产品,其价值取决于理解和应用。因此,我们更可能看到的是一种**“半工业化”**:AI负责大规模生产知识的原料(信息和分析),而人类在此基础上进行精加工,提炼出决策、创意和新理论。成功拥抱这股变革的行业和个人,将极大提高生产力;反之,墨守成规者可能被淘汰。正如一位评论所言:“深度搜索的推出标志着‘简单搜索’时代的终结和‘深度搜索’时代的开端。”对于知识产业而言,这无疑是一场颠覆性的进化。
当AI代理能够承担大量复杂的研究任务后,我们的工作方式也势必发生重大变化。可以预见,在不久的将来,人们的日常工作流程中将深度融入像Deep Research这样的AI工具,许多职业角色会因此调整,甚至出现新旧职业的更替。
首先,知识工作者将越来越多地采用人机协作的新工作流。传统上,一个分析师需要亲自搜索资料、阅读文献、做笔记,然后形成报告。未来,这一流程的前半段(搜集+初步整理)很可能由AI自动完成,人类则在后半段(判断+决策)发力。也就是说,角色分工会发生变化:人类从信息的“搜集者”转变为AI产出的“审核者”和“执行者”。在实际工作场景中,这表现为新的工作流模式——例如市场分析师早上上班后,先用Deep Research跑几个竞争情报报告,在AI整理的基础上挑选有价值的见解,然后结合商业经验写成最终建议。这和过去从零开始调研显然不同。未来的白领可能需要擅长编制AI任务(prompt工程)以及把关AI成果,这将成为核心技能之一。一些企业已经开始培训员工如何与AI协同工作,从而显著提升团队产出。
其次,新的职业角色会应运而生,同时某些旧有角色的重要性下降。一方面,我们可能会看到“AI研究主管”“AI提示工程师”等新职位出现。他们专门负责设计高效的AI查询、整合多项AI输出,并确保AI代理在运行过程中的准确性与伦理合规。这类似于工业时代生产线上新增了质量控制和流程优化人员。在知识型组织中,这种角色将保证AI工具真正服务于业务目标而不出岔子。另一方面,一些传统入门级岗位可能逐渐被淘汰或削减。例如,企业中的初级研究助理、数据搜集员等职位,其主要工作是查资料、做摘要,这些任务正是Deep Research擅长且高效完成的。当AI可以自动完成数小时的人工调查工作,雇主可能就不再需要那么多基层员工来干这些事。这并不意味着大规模失业,而是岗位职责的升级——那些员工需要学习利用AI完成工作,而不是和AI竞争谁找资料快。可以预见,重复性强、技术含量低的脑力工作将逐步消失,取而代之的是围绕AI展开的新工作。例如,法律领域的案情检索、财务审计中的凭证核对等可能大部分交给AI处理,人类法律助理和审计员则更多地负责异常情况的甄别和报告撰写。反过来,AI的加入也可能催生以前没有的职业:比如“AI内容验证师”,专门为媒体核查AI生成的稿件来源是否真实,以防假新闻;又比如“AI驱动商业分析师”,能同时调度多个AI代理完成跨领域的综合方案。这些都是未来工作景观中可能出现的新角色。
工作方式的第三个变化是工作流程更加并行和非同步化。由于AI代理可以自主执行任务且不需要休息,人们可以同时让它做多件事,并在它运转时去处理别的工作。这带来了时间利用方式的转变。举例来说,一个记者可以在睡前让Deep Research搜集某专题的全部背景资料,第二天早上起来直接阅读AI准备的综述开始写作。传统上,夜晚可能是工作的停滞期,现在却因为AI的不间断工作而成为生产期。这种24/7的工作流将打破朝九晚五的节奏,让那些善于利用AI的人实现“睡觉时还有人(AI)帮你干活”的理想。工作流程也更加并行:一个人可以同时监督多个AI代理各自执行不同子任务,然后将结果整合。这在以前需要团队协作才能做到,如今个人也许就能管理自如。因此,我们可能会看到个人生产力的飞跃:少数精通AI工具的人可以完成过去要一整个团队才能完成的工作量。这既是机遇,也是对传统团队协作模式的挑战。组织可能会重组以适应这种高度个人化却又借助AI群体智慧的工作方式。
然而,值得注意的是,这种转变也带来一些潜在的负面影响和社会挑战。当AI承担更多职责后,人类是否会在某些技能上退化?如果新一代员工过度依赖AI搜索,而不亲自训练信息检索和鉴别能力,长远看可能导致专业能力的流失。这类似于导航发明后人们的路感变差——当研究AI无处不在,人们可能变得不擅长无工具的独立研究。教育和职业培训需要针对这点进行调整,培养与AI共生的能力,而不只是单纯地把工作交给AI。另外,职业伦理和责任归属问题也会变得复杂。如果AI提供了错误信息导致决策失误,责任在操作AI的人还是AI本身?目前来看,公司会要求由使用AI的员工负责核实,因此人们必须提高谨慎度,不能因为有AI辅助就放松要求。这意味着未来的知识工作者不仅要有专业能力,还要懂AI、管AI,并为AI可能的错误埋单。这对心理和职业素养都是新的考验。
总的来说,OpenAI Deep Research所代表的这一类AI代理,将深刻改变我们的工作方式。它让人类从繁杂的信息洪流中解放出来,把注意力更多投向高层次的思考和决策。但它也要求我们迅速适应新的协作模式,重新定义许多工作的流程和价值。正如有人大胆预言的:“整个科研(知识生产)体系都将需要重新洗牌”。未来的工作世界里,每个人或许都将配备一个甚至多个AI助手,形成“人+AI团队”共同完成任务的局面。我们正在迈入一个自治AI初露锋芒的时代。这既令人兴奋,也需要我们保持清醒。只有充分认清这种转变的契机与挑战,培养新的技能和心态,我们才能在未来的职场中如鱼得水,利用Deep Research这样的工具达成人机协作的1+1>2效果,而不是被这场浪潮所淘汰。毫无疑问,一个由AGI驱动的工作新时代正在到来,而Deep Research正站在这个时代的最前沿,启示着我们积极拥抱变化,迎接前所未有的机遇与挑战。
来源:资治通鉴通古今