下一代内容操作系统什么样?百度给出新答案

B站影视 2024-12-19 03:17 2

摘要:我一直很关注这个大会。会上,李彦宏推出无代码工具「秒哒」,还有增强检索文生图(iRAG)技术等。

上个月,百度世界大会在上海召开。

我一直很关注这个大会。会上,李彦宏推出无代码工具「秒哒」,还有增强检索文生图(iRAG)技术等。

但让我印象深刻的是,百度把文库和网盘打通,推出的全新内容操作系统:自由画布。

根据官方解释,创作者以后只需要「一拖一圈」的极简操作,就能完成从输入到创作再到分享的整个过程,这可能会颠覆传统创作工具的模式。

我觉得,这不仅仅是一个内容生产工具,更像一个操作系统;今天,申请的内测名额终于通过了,赶紧来迫不及待地感受一下。

简单来说:某种技术、产品或者事件,带来巨大的变化,彻底改变了某个行业的规则。这种变化可能体现在重大的创新上,或者开辟了新的可能性。

比如:

触屏手机出现,取代老式按键手机,改变了人们交流的方式;App Store推出,改变软件分发方式,催生很多移动应用的创业公司。

我把自由画布称作划时代的工具,主要是两个原因:

一,解决了生产工具平台割裂性带来的低效问题;二,推动了模态融合,开启AI协作的新形态。

前几天,有个朋友说,自从AI火起来之后,电脑里装了一大堆AI软件。写文章、做PPT、分析表格,每个场景都要用不同的工具,感觉效率也没提高多少;想要把工作整合到一起,就得在工具之间来回切换。

我最近,也有这种感觉。

前段时间我接了一个客户的方案。大家都知道,做方案不是光埋头苦干就行的,传统流程一个都不能少。我得搜集资料,做市场调研,和客户讨论反馈,确认方案的细节,这些都搞定之后,忙碌的工作才算正式开始。

接下来,我在Word里整理了几十页的反馈,用Excel分析市场数据,做竞品对比,用AI工具整理文案,用Midjourney生成创意图片,在Master GO上设计宣传海报,最后再用PPT汇总整个方案。

你发现了吗?现在AI工具虽然都很强大,但是工具之间的配合却让流程变得特别复杂。

为什么会这样呢?

一方面,AI技术的初期发展需要工具的多样化。写作助手、PPT生成器、图片编辑工具,这些工具的出现,推动了AI在市场中的快速扩张。

但问题是,工具的多样化带来的不是协作,而是割裂性(Fragmentation),不同工具之间数据不通,操作逻辑不一致,我们不得不手动整合。

而要解决割裂性的问题,AI技术要迈向更高的成熟度。

过去,文字就是文字,图片就是图片,它们之间没什么联系,很难实现互动。现在,AI已经能够理解不同模态之间的关系了。

比如:

从一段文案中提取关键词,用来生成一张图片;然后,用这张图片提炼设计语言,反过来调整文案的风格;文字、图片、视频、音频之间的互动,越来越自然。

因为模态壁垒被打破,未来AI将不再是一个个割裂的工具,而是会进化成一个整合的平台:一个能够覆盖从创意到交付全流程的「操作系统」。

到时候,我们不用再为工具之间的切换而感到疲惫,所有操作都能在一个平台上完成,从数据整理到内容生成,一气呵成。

所以,我认为,现在大部分AI工具只是一个过渡阶段。

未来,AI产品终极形态,必然是一体化的操作系统,它将成为无缝协作的智能伙伴;而自由画布,已经看到了这一点,并且迈出这一步。

02

针对于自由画布,我分别做了不同类型的测试。

先说下主观感受,你用过文小言吗?在手机上,只要有问题,打字或语音给它,都能解答;个人觉得,它和文小言最大不同在于:我们用语音、提问等方式能和智能体交互的内容,现在也能放在自由画布上操作。

如果认为表达的有些抽象,别着急,看看体验。

我一开始,打开自由画布,有点懵。它像一张白纸,除了左边的工具箱,什么都没有。

怎么办?

我心想,既然是画布,是不是上传什么都可以?于是,把前几天剪辑ChatGPT的视频粘贴了进来,没想到加载很快,直接能放在上面。

然后,选中视频,旁边有个ChatGPTbot(聊天机器人),我对它说:“帮我把视频中的文本提取出来”,它非常迅速的它非常迅速地开始处理,几秒钟后,屏幕上就显示出了提取的文本内容。

本来以为要自己整理,看来还是自由画布这么方便。

接下来,我试着和它互动,问它视频里的具体内容,或者让总结一下视频的要点。每次都很快回应,准确率也挺高。

这是其中一个测试,它展现出视频转文本、强大且丝滑的交互转化能力。

图示:(左侧面板,右侧直接可视化文档编辑)

既然这么视频可以转换文本,索性来一个更全面的,包括文本、图片、PPT、PDF、视频,看看自由画布对多模态的理解力如何。

前段时间,《再见爱人》里麦琳和李行亮的对话很火,我想做个热点事件深度分析,就搜集不少材料,有照片、文章、剪辑、评价、音频等。

把内容都放到自由画布上,然后,和Chatbot对话,让它帮我整理一下麦琳和李行亮的互动脉络,包括事件背景、热点讨论点和网友评价。

它很快从素材里提取了关键信息,生成一个清晰的框架,包括事件背景、相处模式、婚姻历程、热点讨论点、争议行为、心理学分析等等,一共13条,条理很清晰。

图示:(用百度自由画布梳理热点事件)

有了框架,让它基于文件生成一篇长文,一点按钮轻松搞定了,内容图文并茂,还能标注重点、参考语言风格和逻辑风格等。

所以,自由画布可以整合和分析复杂的信息,灵活处理各种细节。只需简单操作,就能理解和生成多种格式和全模态文件。

你有没有发现,这很像一个人的工作流?

有了一个想法或任务,把不同的素材放在画布上,然后一步一步让聊天助手来梳理。

它打破了垂直AI工具对格式、模态和平台的限制,用一个整体的视角,让我可以从内容生产的起点,到内容消费的终点,完成整个流程。

除此以外,还有诸多细节功能不做展开,推荐亲自体验。

03

不过,自由画布虽然已经展现了强大的潜力,但未来仍有许多可以期待的方向。比如:交互操作可以进一步优化,以更贴合操作习惯。

你知道吗?

白板工具是慢慢发展起来的。“画布”(Canvas)概念很难说是谁最早提出来。它在不同的领域里独立发展,后来成了设计、商业和技术领域里的一个重要工具。

最早在计算机领域,Canvas是计算机图形学里一个可以绘图的区域。在iPhone出现之前,HTML5的Canvas元素已经在网页设计里广泛使用了。

简单来说,这个功能让开发者直接在网页上画图、做动画和处理图像数据。这种灵活性让Canvas成了很多创意应用和交互设计的基础。

但是,这种强大的功能也意味着要一定的技术知识才能用好。后来,美国有家公司叫Miro,在2011年推出了一个基于云的远程协作工具平台,让用户可以在一个“无限画布”上合作。

他们最初的定位是:

没有边界,用户可以随意添加内容,比如图形、文字或者图片,用来头脑风暴、做项目规划或者设计流程图。这种自由和开放的特点,对要远程合作的团队特别有用。

接着,微软的Whiteboard和Surface Hub在2015年看到了白板的潜力,他们想取代传统的物理白板,支持团队在一个数字空间里实时合作,就把它加入到了自己的产品线里。

这两款产品,虽然已经成为Microsoft 365的一部分,并且不断更新改进,但我觉得它们在操作协同上还有难点。

比如:

写文章、做海报是明确、单一的任务。但制作PPT是一个项目,因为它要收集内容、找素材和数据,甚至可能要很多人一起做。

你发现了吗?

很多人用白板时,没有这种思维方式,也不懂从整体到细节、从细节到整体的工作方法。

他们不知道要先定一个任务,围绕这个任务收集内容,让它一点点积累起来;也不知道如何从细节出发,慢慢整合信息,形成完整的方案。

这种缺乏结构化思维的方法,让人面对白板时常常不知道怎么办。

微软以前没解决这些问题,连OpenAI旗下的ChatGPT推出Canvas时也没解决这个问题。这是因为画布改变了端到端的交互形态。

这其实反映了一个核心问题:白板工具的使用,不仅仅是工具本身的问题,更是用户思维方式和工作习惯的问题。

对于大多数人来说,白板工具提供一个开放而自由的空间,但这种自由也可能带来困惑;没有明确的引导和结构化的支持,用户很容易陷入“无从下手”的状态。

这也是,为什么许多白板工具在功能上看似强大,但实际使用中却未能充分发挥它们的潜力;用户需要的不仅是一个「工具」,更是一个能够帮助他们理清思路、组织信息的「助手」。

我觉得,自由画布看到了机会点,它承接了传统白板工具的优势,又通过端到端的交互方式,和AI智能功能,帮用户完成了任务。

所以,自由画布不仅是技术进步的产物,更是对未来工作方式的一次大胆探索。

04

探索,怎么探索?我认为,自由画布对形态演变的思考,体验有两点:一,让自己搭上了技术进步的「大船」,二是通过网盘与文库资源的整合,推动了高效协作的变革。

现在,各种各样的工具让我们更快地学会了怎么用AI,以线上开会为例:

以前,我们根本不太习惯云会议,现在大家都会想着怎么在网上开会,怎么用AI记会议纪要;这种技术进步让我们更快地适应新的工作环境,优化工作流程。

所以,AI工具的多样化,确实帮了不少忙。

另一方面,自由画布有诸多原生的能力。

百度文库有很多公开的资料,百度网盘可以存我们自己的文件。我们可以把文库里的好文档,或者网盘里的会议录音拿出来用。

当这两个服务结合起来,自由画布就能打破公共资料、经授权用户后私人资料之间的隔阂,这样在内容创作过程中,工作流就不会被跨平台、跨应用所切断,AI应用之间也不会有数据不通的问题了。

还有一点,用自由画布,可以很方便地用这些资源创作内容,AI生成的内容质量高,能让整个内容生态更丰富。这样,大家就更愿意用AI来改变内容消费的方式。

所以,自由画布在这个时候,一边搭上了技术进步的“大船”,一边又通过文库、网盘资源推动了高效协作的变革。

去年上半年,我一直在想,终极的AI界面是什么?

它应该叫White Paper,用一个iPad,加上一支笔和一个麦克风搞定一切;作为用户,只要发起任务和评价结果,不再参与具体操作,这种人机界面是未来「Agents时代」的工作方式。

我觉得自由画布的最终形态,就是「White Paper」,现在,它以操作系统的形式出现在我们面前,何尝不是划时代产品?

未来,它会带来什么样的变化?会如何改变现有工作流?确实值得期待。期待百度未来能够更进一步地扩展,让「自由画布」有更广阔的操作空间;也希望大家,早点用上自由画布。

来源:王智远一点号

相关推荐