摘要:用户输入一段需求,这些产品很快就可以生成一份制作精美的PPT,用户还能选择各种各样的模板并手动对PPT内容进行编辑、修改,最终导出一个PPT文件用于演示。
在干掉和抛弃传统文档之外,WPS选择了重构并提升传统文档。
作者|王博
在今年的世界人工智能大会,我看到有不下十家企业都做了AI PPT类的产品。
用户输入一段需求,这些产品很快就可以生成一份制作精美的PPT,用户还能选择各种各样的模板并手动对PPT内容进行编辑、修改,最终导出一个PPT文件用于演示。
这看起来不错,但当我进一步提出需求,比如“帮我把PPT改成更加轻松的表达形式”“帮我在XX部分加一些案例”,几乎所有AI PPT类的产品都是口头答应,但实际只能在聊天框生成一些建议和文字资料,并不能真正像个助理一样,直接上手帮我改PPT。
它们大多只会生成PPT,但不会使用PPT。
某AI PPT类产品AI聊天框截图,图片来源:「甲子光年」截图
究其本质,这些AI生成的PPT只是长得像PPT,它其实是个HTML网页,并不是一个符合Office编辑器标准的PPT文件。
尽管现在让AI生成文字、图片、视频不再是难事,但让AI学会像人一样操作“办公软件三件套”,全球只有两家企业可以做到:一家是微软,另一家是金山办公WPS。
7月27日下午,金山办公在世界人工智能大会现场发布了WPS AI3.0版本——WPS灵犀,用户只需通过自然语言、多轮对话即可完成文档创作、演示文稿生成及语音助手等功能,全程无需复杂操作和外部跳转的步骤。除WPS灵犀外,WPS知识库也随着WPS AI 3.0的推出正式亮相。
可以说,WPS灵犀是真正意义上的原生Office办公智能体。
它不仅会生成内容,还会像人一样使用Writer(文字)、Presentation(演示)、Spreadsheet(表格)。尽管很多协同办公软件(包括WPS协作)以及AI工具已经可以满足很多日常办公需求,但其实我们的生活和工作中依然离不开传统文档(文字、演示、表格)。
一组数据可以说明这一点,金山办公2024年年度业绩报告显示,WPS Office全球月度活跃设备数已超6.32亿,创历史新高,其中WPS Office PC版国内日活跃设备数突破1亿。最新数据显示,今年3月底,WPS Office全球月度活跃设备数已达到6.47亿。
尽管现在有很多协同办公软件和AI工具,但这并不意味着传统文档不重要了,也不意味着传统文档的智能化需求不存在了。论文、公文、合同、通知、PPT……这里藏着很多常见却容易被忽视的需求。
在世界人工智能大会7万平方米的展区中,AI的应用上天入地,但真正在用AI解决传统文档用户需求的,只有WPS。
目前市面上的AI PPT类产品大多在AI方面表现不错,可以生成不错的大纲,套用模板后,可以生成版式还不错的PPT。
这在一定程度解决一部分用户的需求,但是这种由HTML网页导出的PPT文件存在格式不兼容的可能性。另外,导出PPT之后,如果用户还想修改里面的内容和排版,会非常麻烦,往往还是需要用户自己上手修改。
有一个不争的事实是:在相对严肃的汇报、教学、商务等场景中,PPT很难出现“一版就过”的情况。
往往会出现的场景是,员工做了一版PPT,上级领导给出修改意见,或者直接用手戳着屏幕,一页一页修改。而且,很多时候,上级领导提出的修改意见又比较模糊,比如需要“严谨一些”“更有深度”“加点案例”。
这其实是一种“边聊边改”的场景。
这种场景,大多数AI PPT产品是无法应对的,它们有的可以“聊”,给出一些建议,但是实际的“改”,还是得用户自己上手。而且无论是生成还是修改PPT都在网页,并不是正规的PPT软件中。
而这一次,WPS灵犀给PPT带来了“边聊边改”。
WPS灵犀AIPPT
制作PPT离不开大纲。用户可以提出需求,要求WPS灵犀直接生成一份PPT大纲,或者上传一份文件,要求WPS灵犀改写成PPT大纲。
如果用户对这份大纲不太满意,就可以用自然语言对WPS灵犀提出各种修改大纲的需求,比如“开头更吸引人一些”“加入一些互联网黑话”“在合适的章节加入XX案例”“结尾加个金句”,WPS灵犀就可以根据用户需求分析“哪里是开头,什么内容更吸引人”“互联网黑话是什么,可以加在哪里”“XX案例是什么,更符合哪个章节的内容”“结尾是哪里,适合的金句是什么”,并直接在大纲中修改,用户可以选择接受或者不接受。
WPS灵犀“边聊边改”PPT大纲
在大纲环节进行这样交互,可以让大纲更符合用户需求,提高后续套用模板生成PPT后的可用性。控制住大纲,也就控制住了PPT。
如果用户对于生成的PPT不满意,还是可以回到大纲环节,继续对WPS灵犀提出其他内容修改需求,进一步打磨大纲,进而让WPS灵犀生成更符合用户需求的PPT。
金山办公演示产品负责人陆炜俊告诉「甲子光年」:“我们的产品规划并不仅仅是‘边聊边改大纲’,未来会发展为‘边聊边改模板’‘边聊边改每一页PPT’的全面创作过程,从而实现‘边聊边改创作’,这也是我们的目标。”
除了“边聊边改大纲”之外,WPS灵犀还支持AI图片替换、灵活增减项、PPT生成演讲稿、演讲视频等功能。
WPS灵犀PPT生成演讲稿
“AI生成HTML所有人都能干,没有壁垒,而从HTML到PPT只有WPS和微软能干。” 陆炜俊说,“我们的核心优势,用一句话概括就是,37年来对Office编辑器的深刻理解。”
正是这种理解,让WPS灵犀学会了使用PPT,但PPT只是它的技能之一。
WPS灵犀与WPS Office深度协同。目前在WPS Office的部分组件中已经形成了左侧Office套件、右侧WPS灵犀的同屏交互形态。
在文字组件中,用户直接在右侧的对话框中用自然语言提出需求,AI在识别用户意图后,即可对左侧文档区域进行修改,全程无需跳转其他应用。相比于其他产品,WPS灵犀具备多轮对话、修改可控、格式保留等优势,能控制AI生成用户真实可用的成果。
例如合同文件,格式要求严格,而且存在图、文、表混排的情况如何在不破坏格式的前提下,快速填入相关信息呢?用户只需要告诉WPS灵犀基本的姓名、地址、电话、金额等信息,WPS灵犀就可以把相关信息填到正确的位置。另外,WPS灵犀还可以为用户提示合同条款中潜在的风险,并为用户拟定并在合同文档中修改所需要的条款。WPS灵犀的这些操作都不会影响原合同的格式。
WPS灵犀在合同修改场景的应用
而这个过程也是“边聊边改”。金山办公文字产品负责人王中秋介绍,为了实现这样的效果,团队曾经尝试过Markdown和HTML的多轮改写方式,但效果都不太理想。今年年初,AI大模型能力不断增强,让团队想到了一种实现方式。
WPS的实现方式是,在Office编辑器和AI大模型之间约定一个中间协议。这相当于是一个映射表,里面包括了很多样式,而这个协议AI大模型可以理解。最后,AI大模型会产出一套带着标签、样式的内容,并最终通过渲染在相应文档中实现带格式的修改。
而在PPT中,团队用的是“原子化分层”的理念。陆炜俊介绍,PPT的结构其实有三层:第一层是对象内容,包括文、表、图;第二层是排版;第三层是模板、样式。WPS可以做到每一层的单独更换和调整,而这种“基建能力”为打造AI Agent提供了良好的基础。
有了基础,还需要大量的工程工作。
“AI大模型能够生成高质量的Markdown、HTML文档,是因为它在训练过程中学习过无数的网页数据,然而,AI无法生成符合Open XML格式文件,比如PPT,因为它缺乏相应数据的训练。”金山办公助理总裁田然介绍,“反过来,我们的组件拥有大量API,但AI不会用,我们需要在组件里面去做一套新的、专门为AI服务的API。”
这其实是一种复杂的平衡,一方面要保留AI的创造性和对知识的理解,另一方面要让AI能够利用这些API,按规矩操作办公软件,此外,在这个过程中又不能过度消耗AI的资源。
“我们希望利用而不是限制AI的能力,我们在文字和演示上已经找到了这个平衡,而在表格上,我们仍在寻找那个平衡点。”田然坦言。
目前,这种AI与办公软件的深度融合已经带来了全新效果。在WPS办公组件中调用WPS灵犀,AI能够识别并解析数千种格式组合,让Office文档的修改保留图文混排、复杂表格、多级列表等原始版式细节,无需手动二次排版。
在2025世界人工智能大会期间,金山办公还发布了灵犀语音助手,为用户提供了移动办公场景下的AI对话与文档处理能力。用户在手机端直接与AI语音交流,像与文档“聊天”一样,就能快速获取文档要点和全网信息。通过文档“开口说话”能力,投资经理能在几百页的财务报告找到关键信息;求职者能根据简历和面试岗位文档模拟面试场景,轻松获得陪练“搭子”;学生能用它出测试题,模拟考试场景。
WPS灵犀语音助手
除WPS灵犀外,WPS知识库也随着WPS AI 3.0的推出正式亮相。
WPS知识库能将用户的云文档升级为知识库,让知识的查找和学习不再是大海捞针,每个人都可以拥有专属的“私人知识银行”。用户可以在WPS知识库上搜答案、筛数据,基于私域知识写方案、写稿子、写汇报,解决知识碎片化检索、应用和分享难题,提高工作和学习效率。
WPS知识库
金山办公知识库产品负责人赵九州告诉「甲子光年」:“我们是基于Office文档的知识库,这是我们和市面上其他知识库产品最大的不同。”
赵九州认为,WPS知识库最大的价值一方面是可以把用户的历史经验和知识快速地导进来,而不需要用户手动上传,另一方面是可以让用户快速找到历史知识,而且要找得准、标注来源,“我们希望让更多Office文档用户也能快速地拥有自己的AI的文档助理。”
「甲子光年」认为,只有具备原生Office能力的团队,才能打造出真正意义上的原生Office办公智能体。
从目前的应用与探索来看,WPS灵犀代表了办公软件的智能化发展方向——Agentic Software(代理式软件)。
Agentic Software可以理解为一种具备自主决策和主动执行能力的软件系统,而非被动等待用户发出每一步指令。
Agentic Software代表了未来软件交互方式的革命性变革。过去的软件是工具型,被动、单向执行;现在的软件是助手型,有一定建议和引导能力,但仍依赖于用户明确指令;未来的软件,也就是Agentic Software,会是主动型、自主型,能根据用户模糊目标主动制定和实施完整解决方案,达到真正的人机协作与智能化的效果。
田然认为,此前AI行业面临的两大问题,其一是AI能力藏在软件后面,用户能看到软件变强大,但AI的能力无法完全发挥;其二是用户通过聊天机器人调用AI能力,但单次生成的内容看似炫酷,但并不实用,甚至不能用。
基于此,金山办公今年推出以WPS灵犀为核心的WPS AI 3.0,尝试推动AI和办公软件的深度融合,“不是把软件的10000个API教给AI,而是针对场景做AI和软件的双向改造,软件为AI设计专有能力,同时教会AI跟软件深度交流,最终依靠用户、软件、AI之间多轮交流,输出真正可用的内容。”田然说。
可以说,WPS AI 3.0正在探索重新定义用户、AI与软件三者的交互关系,推动AI办公向Agentic Software演进。
金山办公助理总裁田然分享WPS AI 3.0的理念
「甲子光年」了解到,针对场景做AI和软件的双向改造,在金山办公内部经常被比喻为隧道两头,一头是AI技术的应用,一头是Office的智能化升级。
“现在可能呈现出百花齐放的局面,但在办公软件市场,最终存活下来的将是那些能够实现隧道两端贯通的公司。”陆炜俊说,“我们相信,未来五年,隧道两头将会贯通。”
但也有一种担忧,如果隧道的一头没有那么重要了怎么办?假设一种情况,如果有一天,PPT不是最终呈现形式了(比如换成网页或其他交互方式),对WPS来说会是危机吗?
陆炜俊告诉「甲子光年」,尽管目前有一些创业公司的产品可以解决演示的需求,但是PPT不会消失,它仍会长时间存在。
“我们调研发现国内的PPT文件的产生数量仍在持续增长,很多用户,尤其是基层的用户,不仅需要演示的功能,他们还需要在没有网络的环境下将PPT文件播放出来以完成演讲。”陆炜俊说,“我们能满足用户日益增长且多元化的演示需求,但同时能够保证PPT文件兼容。”
从某种程度上来说,WPS灵犀作为原生Office办公智能体不仅仅是一种新生产资料,更代表了一种更先进的生产关系。生产关系既反映生产力水平,又对生产力具有促进或制约作用,不论是蒸汽机时代还是AI时代,这种变革的背后都离不开对生产关系的重塑。
回顾历史,蒸汽机的出现不仅是新的生产资料,更让工厂里的劳动组织方式发生剧变:集中化、大规模、工人协作——这便是新的生产关系,它一方面反映了蒸汽机所代表的生产力水平,另一方面又通过流水线、车间制等形式反过来推动了更高效的动力机具和工艺的诞生。
同样地,WPS灵犀作为原生Office办公智能体,正在突破了“人命令机器做事”的传统模式,迈向“人与AI协同共创”的新范式。
田然认为,WPS灵犀并非一个孤立的软件,而是一项跨端、可嵌入的长期服务,“长期来看,我们认为WPS灵犀是一种服务,而不仅仅是一个软件。”
可以预见,未来的WPS灵犀将以更灵活、更普适的形式嵌入到多种智能终端中,比如AI眼镜、智能耳机甚至智能汽车中,构建起真正意义上的办公无处不在的智能化生态。
在通往Agentic Software的路上,WPS没有抛弃任何一个使用传统Office文档的用户。
来源:甲子光年一点号