对话即服务:LUI如何重塑数字世界的运行法则(一)

B站影视 日本电影 2025-06-06 10:53 2

摘要:随着AI技术的飞速发展,自然语言用户界面(LUI)正在成为未来交互范式的重要组成部分。本文探讨了LUI作为AI时代交互模式的必然性,分析了其本质特征、优势以及对产品设计的深远影响。

随着AI技术的飞速发展,自然语言用户界面(LUI)正在成为未来交互范式的重要组成部分。本文探讨了LUI作为AI时代交互模式的必然性,分析了其本质特征、优势以及对产品设计的深远影响。

日常生活中常常被一波波“重磅”“震惊”“炸裂”这类文章冲击眼球,总有一种被裹挟在一股巨大的力量中,但又看不太清楚周围状况也看不清楚前路方向的感觉。于是我常常在想,我们现在正处于巨大变革的哪个阶段?可期的那个未来究竟会是什么样的?带着一连串的疑问,我每天都会去寻找一些优质的文章来读,想看一看处于这股力量前沿的弄潮儿们的观点与洞见,重构自己的认知。因此,我也会通过系列文章主题,吸收总结一下最近所读的精彩观点,并记录自己对未来AI时代产品的一点一滴的思考,串联起一条科技革命的迭代轨迹。

关于本系列——LUI

作为AI时代的产品经理 & 通向AGI之路的AI产品经理,需要不断从产品层面思考如果AI成为了所有产品的基座之后会发生什么、新的设计范式是什么、通往这个目标需要历经哪些milestone。这几年,大家已经在积极尝试“把AI塞进产品里”,且在少数领域已经出现了有模有样的AI-native,比如正在百花齐放的AI Coding。

但不要只盯着“把AI塞到产品里”这个一阶机会。看得更远一点,想得更深一点,才能找到少有人走(并且居然正确)的路。作为AI时代的产品,先看见未来的模糊样貌,先洗掉一些过时的习惯习气,才更有可能创造崭新的世界。

第一个主题,有关未来的交互范式——LUI(Language User Interface),通过这一个主题,先看见未来的模糊样貌,洗掉一些过时的习惯和观念,才更有可能创造崭新的世界。(来源文章见本文最后)

为什么LUI是AI时代的必然选择

“未来99%的软件会消失?”“LUI是无可争议的未来?”“现在的GUI(即软件)会成为LUI的内容?”“提前认命老老实实做个API?” 不知道看到以上这些观点你是什么感受,是感到震惊、荒谬还是点头认同亦或是茅塞顿开,这些即是我最近所读文章的观点,以上感受亦是我个人这段时间的心路历程。 这一系列文章主要讲了LUI作为AI时代的交互范式,其优势、挑战、实施路径以及对产品设计的影响。

LUI的本质特征解构

LUI 也就是聊天,将是人跟AI最重要的交互形式,没有之一。这个结论适用于所有AI产品,不仅仅是聊天机器人。 这背后的本质原因是:只有语言有足够的灵活性,可以驱动AI去满足近乎无限的场景需求。未来,GUI都将是被LUI灵活生成的。

LUI也就是基于聊天(文字、语音等)的人机交互方式,通过理解和响应用户的自然语言指令,提供更加直观、便捷、人性化的交互体验。LUI将是人与AI最重要的交互形式,这背后的本质原因是:只有语⾔有⾜够的灵活性,可以驱动AI去满⾜近乎⽆限的场景需求。

LUI最大的改变是:从开发者主导到用户主导。

GUI产品的本质是,把能力封装到一个图形界面里,用户按照产品定义的规则和路径去点击界面元素比如按钮、勾选框、卡片表格等,去实现某些能力,所以GUI本质是以构建者为主导的一种模式。在原来的计算能力下,软件没有办法解读你的意图,所以用软件上的一个个固定顺序的页面、组件来预设你的意图,或者说把你的意图展示出来。每个展示的界面背后,就对应相应的API。但这是一种固定的方式。

LUI完全是需求者主导的模式。举个简单且直观的例子,人类的需求是不变的,对用户来说仍然都想要一张很漂亮的图片,无论通过photoshop或者Midjourney,这个需求是不变的。与此同时什么又是变化的呢?在photoshop中,用户与它交互的逻辑是对象和命令。但在midjourney里面,用户用自然语言敲出来的不是对象,也不是命令,而是用自然的语言说出来了人类的欲望。也就是说人类的一些根本的需求是不变的。但是交互的逻辑有根本性的变化了。

有了LUI,现在的通过GUI封装的能力,未来不一定还会封装在软件应用里,而是更容易被API化,然后在不同的应用里被调用。用户输入自然语言进来,意图被解读之后,就分流到各个API去调用各个能力。

LUI的优势

LUI能让“意愿解读”和“功能实现”之间解耦开,让能力更容易被充分表达GUI其实是让用户走进我们设计的迷宫,路径有限,设计用户每一步要怎么走,后台开发也会把很多小模块耦合在一起。但如果是LUI的设计,允许用户东一榔头西一棒子提出需求,我们后台就会默认把能力颗粒度变细,然后一个一个解耦单独放出来。这种颗粒化能力,且能够被单独调用,这就是API。

Web3有一个概念是“可组合型”,考虑的更多的不是人机交互界面,而是机机交互,我的agent如何被main agent发现、如何被合理地调度、如何获取商业价值,以及为了交付好的结果,我应该如何主动去搜寻、评估和整合其他agent。

LUI最底层有两个价值,一个是让用户用得很爽;第二就是把APP的墙和软件的墙推倒了。 看到这里,你是不是像我一样有这样一个迫不及待的疑问:明明GUI时代用户只需要点一下就行,换成聊天却要输入一大段文字,效率简直太差了,更何况现在相当一部分人的语言意愿和能力已经在奶头乐中退化了! 是的,LUI最让人诟病的两个地方:一个是效率,另一个是幻觉。

可以说,效率是GUI的目的,你本来就不该指望还有别的交互形式能在效率上超过它。以淘宝商品搜索结果列表的交互为例,你能指望它在效率上还有多大的提升空间吗,那可是一帮最聪明的人花了20年在几十万亿的交易额下优化出来的交互形态。

有没有一种可能,AI时代,效率不是最重要的,意图的实现才是?(我把它称之为解决问题的效率)你当然可以高效地挑选商品,只需要花几次点击。但什么商品都不用挑,完全不操心,AI直接帮你买好寄到家里,这叫意图的实现。

所以,我们需要意识到,LUI不仅仅是表面的聊天,它是关于语言、理解、记忆、主动性等等的整体。期待LUI在效率上超过GUI,就相当于指望一辆汽车是最好的马车。我们目前离真正的“意图的实现”还有一小段距离,而这恰恰是机会所在。

本人有话说:我上一份工作是智能客服的AI产品经理,智能客服算是AI2.0时代比较成熟典型的应用落地。产品形式非常类似这篇文章所说的LUI:用户在聊天框输入自己的诉求,识别到用户的具体意图后,去调用各个API实现用户售后、查询物流等等诉求。所以对我来说其实比较容易建立起来LUI的认知和实现框架。

这篇文章主要介绍了我写LUI这一系列文章的目的,并在第一篇文章中介绍了什么是LUI、LUI的本质特征和优势。下一篇,我会介绍LUI与GUI(图形交互)的关系,以及未来什么样的APP会留存。

本文由 @「爱」原生 原创发布于人人都是产品经理。未经作者许可,禁止转载

题图来自Unsplash,基于CC0协议

该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务

来源:人人都是产品经理

相关推荐