「AI务实派」百度:不重炫技,重交付

B站影视 内地电影 2025-06-10 21:54 1

摘要:在当下,「AI取代不了人,但不用AI的人将被会用AI的人取代」一语风行。但就提高大众AI素养问题看,与其奚落不会用好AI的人,不如让AI变得更好用。

对AI而言,能「完整交付」才是硬道理。

文 | 佘宗明

在当下,「AI取代不了人,但不用AI的人将被会用AI的人取代」一语风行。但就提高大众AI素养问题看,与其奚落不会用好AI的人,不如让AI变得更好用。

技术专家贾斯汀·威斯科特就说:目前大多数LLM(大语言模型)就像有无限工具的瑞士军刀——令人兴奋却也让人不知所措。但用户其实不想搞清楚AI,他们想要的是解决方案。

在他看来,如果AI要取代应用程序(APP),它必须变得隐形,无缝集成到日常工作流程中,而不需要用户记忆功能入口、设置格式参数。

言下之意,AI产品理应「把复杂留给技术,把简单留给用户」。

我对此的理解是,如果将AI比作赛博大厨,那时下很多AI产品就是止于给用户「递食材(图文信息)」,可用户想要的,是能直接端上一桌「大餐(如工作报告、行业研报等)」。

该怎么让AI端上一桌「大餐」?

百度文库、网盘给出的全新解法是:拍一下。

打开百度网盘APP里新上线的「AI相机」,对着「菜单」拍一下(输入),它非但能识别「菜品」、推荐「菜谱」(处理),还能生成包含采购清单、烹饪步骤、摆盘设计等在内的「菜谱包」(交付)。

用户点击百度网盘App上方相机入口进入后,即可体验新上线的「AI相机」功能。

一通操作下来,你会发现,AI相机已不光是拍照工具,更是开启全模态智能世界的入口。它连着的,是百度文库、网盘在行业内率先构建起的全模态输入、处理、输出的系统化完整交付能力。

而完整交付能力,正是AI越过从「能用」到「好用」那条金线的关键所在。

01

尽管桌面上的AI产品图标数量已突破个位数,但不得不说,「创作链条割裂化」和「交付结果半成品化」仍是很多用户在内容创作与消费、信息生产与获取过程中的共同痛点。

《新周刊》此前报道中提到的「为制作一份30页的行业报告,需要先让ChatGPT生成框架,再调用Claude优化表述,最后还得用Grammarly检查语法——整个过程下来反而比传统方式更耗时」情形,绝非孤例。

这道出了时下许多AI工具的硬伤:虽然AI产品百花齐放,但受制于多模态输入需求与工具单一处理能力的矛盾、公私域数据资源整合的瓶颈,很多AI产品缺乏「意图理解-内容生成-多形态交付」的连贯性,且只能提供基础性素材。

随之而来的,是用户找资料时得在文档工具、网盘、专业数据库里来回找,设计时要在PS、PR、AI、AE工具中频繁切换,经常还得手动拼接那些图文并茂的文章、有专业图表的PPT、带声音的视频等。

《新周刊》的文章截图。

这就对AI产品提出了交互门槛降低、处理复杂任务能力提升两点要求。在这两点上,百度文库和百度网盘作为目前能力最全面、交付最完整的AI产品,就扮演了积极的探索者角色。

在大模型重构下,前者已成为「一站式AI内容获取和创作平台」,后者也升级为了「一站式内容服务平台」。

二者进行全面融合和能力共建,打通从「创编存管」到「找看用享」全流程环节后,更是实现了能力厚度与广度的拓展,让AI在用户所需之时「无所不能」、所需之处「无处不在」。这标志着,百度在多模态AI领域拓展了从底层积累到场景拓殖的闭环深度。

如此一来,用户从发起需求到拿到成品几乎可以全程无忧,能在一站式需求满足中感受到AI带来的高效便捷。

02

说到完整交付,首先其实是要满足用户的多种模态文件的输入需求。

而全模态的输入能力,在AI相机中就得到了充分的体现。

试想这番景象:部门开完会后,以往为怎么捋出杂乱板笔记中的要点的你,用相机对着白板一拍,之后就有「人」自动干活,如文字识别、手写涂鸦转译、重点标注、生成待办清单,还做成PPT,躺在了你的网盘文件夹里,你可随时分享给同事。

听起来,是不是很梦幻?但就是百度AI相机施展的「魔法」。

跟传统相机聚焦于拍摄有别,百度正重构很多人对「相机」的认知:它打造了打造「存、管、用、创、享」一体化入口,用户拍下的照片不仅能一键存储、智能分类,还能直接触发修图、文字提取、翻译、扫描、创作等全链路操作。

用户可拍摄照片或从网盘/手机本地相册导入照片,并通过「AI相机」使用修图美颜、拍照识别、解题、文字提取、翻译、扫描、合同检查等一系列AI功能。

也许听着它的那些核心优势——即拍即存+直存云端、全场景智能处理、一站式修图处理、长期管理与回忆功能等,用户可能只有粗线条感知。

可如果知道它能消除内存焦虑,能在学习场景自动解题、工作场景智能扫描转化、生活场景万物识别推荐,能轻易进行人像修图、线稿提取、绘画风格转换、去水印等操作,能实现智能化识图、转文档、拍照解题等功能,许多人想必会有所触动。

若是知道它还能自动按地点、人物、事物、类型等多维度对照片进行分类还能智能搜图,能采用影像精选策略、大模型生成文案并一键导出社交媒体,很多人兴趣还会更浓。

当学生拍照后,AI会生成解题思路、错题归档、举一反三出题;当职场人士扫描合同后,系统自动检查风险条款、生成修改建议……AI相机变成图像内容一站式服务、全模态超级入口的价值,也会来得真切可感。

AI相机补全全模态输入的「图片输入缺口」,本质上也是为深度完整交付能力做加法。

03

得看到,「从食材到宴席」的深度完整交付能力,背靠的是百度独有的技术组合拳:文库公域+网盘私域的双数据库,相当于丰富食材库;全球首个内容操作系统沧舟OS的调度中枢系统,就像是宴席总厨;百余项 AI Agent,可看成各菜系厨师。

从完整交付内含的「输入-处理-输出」三个流程看,打造「全模态需求接收→多Agent 智能调度→端到端完整交付」的闭环不可或缺。

多模态输入来说,学生党能否在学习场景中拍题向AI求解,职场人士能否通过上传图片将纸质文件转换成电子文档进行智能编辑……也就是能不能让用户以最自然最便捷方式表达需求,很考验AI产品技术能力。

不少AI产品在捕捉用户需求时,文是文、图是图、语音是语音、视频是视频,就算有多模态,也无法完全接收转换。

但百度文库网盘能够全天候和全方位地接受并响应需求,启动任务。无论用户处于何种场景(如学习、办公、生活娱乐等)、在哪个地区、使用何种设备(如手机、电脑、平板等),都可以通过键盘、AI相机、AI视频、AI麦克风等多种输入方式,向系统输入需求。

多模态处理而言,以往需要用户一次次「点击确认下一步」的任务,现在能否自动调用OCR识别、语义消歧、逻辑推理等子模块,形成自适应服务链,很重要。

而以「文库公域专业资料库、网盘私域数据库、用户记忆库(三库)+百度学术平台(一平台)+阅读器、编辑器、播放器(三器)」为依托的沧舟OS,不光是高度智能的需求识别与任务分发中枢,能将一句话一个详尽的To Do List(待办事项清单),还能开启贾维斯的能动模式。

全模态处理是实现完整交付的关键环节,其核心支撑则是作为技术底座的沧舟OS。

百度副总裁,文库事业部、网盘事业部负责人王颖就曾说过,沧舟OS跟其他操作系统的区别是,其他操作系统主要的是提供「大脑」,上面那些应用程序是「四肢」,沧舟OS则是既有大脑(智能决策中枢)也有四肢(完整工具链)的「超能人」。

再就多模态输出来看,考虑到用户实际需要,是否具备全模态交付成功的能力很重要。

跟传统AI产品提供的多为「半成品」不同,百度文库网盘可直接奉上「成果包」——包括应用户之需输出的PPT+文案+图表+音视频的全模态、全格式内容。

04

当AI开始学会「理解需求全貌、规划任务链条、整合资源交付」,它就不再是工具链的一环,而是成为了能替人解决复杂问题的智能搭档——这或许才是AI该有的样子。

说到底,人们使用AI,要的不是使用本身,而是解决问题。解决问题的应有之义就是完整交付。

百度文库网盘就在将多年来的技术积累,转化为面向用户真实需求的完整解决方案。无论是用AI相机的「一拍即存即处理」来为全模态输入不缺,还是用百度文库先前推出的GenFlow超能搭子的「多模态内容一站式生成」来最大化地满足用户之需,都裹着浓厚的「交付导向」色彩。

百度文库、网盘构建起了全模态输入、处理、输出的系统化完整交付能力。

到头来,百度文库网盘蓄积了在内容创作、内容消费、个人知识库等方面行业领先的AI赋能能力,也引领着大模型行业从深度思考走向深度交付的新趋势。

数据会说明很多事情:百度文库曾数次登上AIGC应用榜单「AI产品榜」榜首,AI月活用户达9700万,网盘AI月活超8000万,6月初位列AI产品榜国内总榜第一、全球总榜第二(仅次于ChatGPT),就是用户对其系统化完整交付能力的认可。

而迎来新增长曲线,也成了百度文库网盘形成覆盖创作、管理、消费的全生命周期服务能力,继而在内容创作效率与交付质量上实现代际领先激起的市场回响。

一方面,由于解决了用户时间成本与精力损耗上的痛点,让AI切实变成生产力工具,两大产品的用户粘性与付费意愿得以提升;另一方面,用户从文库获取知识,在网盘存储管理,再通过AI相机与GenFlow创作新内容,也能涵养可持续、更繁荣的内容生态,强化百度在AI信息内容领域的竞争壁垒。

可以预见的是,当文库网盘以深度完整交付兑现「把复杂留给技术,把简单交给用户」的潜在承诺时,这会无形中强化「用AI,来文库网盘就够了」的用户心智,也会为国民级应用树立AI时代的新价值标杆。

来源:数字力场

相关推荐