摘要:从语音、视觉到多模态交互,从静态界面到动态自适应设计,AI 交互正在经历一场深刻的变革。本文将深入探讨 AI 产品交互的新兴趋势,以及低代码和无代码 AI 集成的发展,供大家参考。
从语音、视觉到多模态交互,从静态界面到动态自适应设计,AI 交互正在经历一场深刻的变革。本文将深入探讨 AI 产品交互的新兴趋势,以及低代码和无代码 AI 集成的发展,供大家参考。
随着ai 产品 增长和创新的井喷爆发,在新推出的ai 产品上,我们也看到了新的交互形态。ai 对交互的要求,技术和工具的赋能,使交互设计在个性化,多模态 和自适应拟真 等层面不断更迭。许多ai 初创公司也在新型交互上呈现了新的探索和尝试。
语音视觉多模态交互与情景自适应多模态交互能力
下一代人工智能界面有望超越基于文本的交互更多实现多模态交互能力:
先进的语音和语音识别具有增强情感智能的自然语言处理视觉和手势输入集成不同交互模式之间的无缝转换情境性和自适应界面
人工智能界面的未来正在超越静态交互,走向更加动态和情境感知的体验。许多ai 初创公司正在探索能够:
根据用户上下文和偏好动态调整提供基于实时理解的个性化交互跨多个平台和设备无缝集成Vapi (https://www.vapi.ai)
图片来自voiceAI官网
对于复杂的工作流配置功能,以画布形式呈现产品工作流,为用户提供一目了然的画面感,成为ai 交互产品中的一种主要交互模式。以ai 初创公司 vapi 为例,这是一款面向开发者的ai 工具,他们的使命是voice AI for developers,帮助开发者在短时间内高效创建,测试和部署语音agent。这个产品面向的关键用户是希望在自己的移动应用中集成语音助手(voice agent )的开发者。在与agent 对话过程中,ai 对提问者中断的反应
考虑到在语音交互,信号接收以及反馈的过程中,用户对语音交互的延迟感知非常敏感,对语音交互延迟的感知细化到了毫秒级别(millisecond),也就是对反应延迟的控制精度要求。
更近一步,在语音交互过程中,ai 可以通过实时学习对话内容,自适应应答。例如,用户a在跟ai 的对话中被用户b打断,那么ai 会自动识别对话者的切换并且在接下来的对话中进行调整。
Retell AI (https://www.retellai.com)
华人创始团队的ai公司retall ai提供了ai 语音客服服务,并且能够根据用户所在场景自适应调整交互模式和对话内容。官网目前支持的场景包含商机管理,前台接待人员,调研,客服,催收等等。同时在交互中实时进行自适应,例如,在识别出对话对象处于休假状态的时候,会根据休假场景自动作出回应。
无限画布重构ai 交互在新兴ai初创中,我们同时也看到无限画布的交互方式在不同ai 产品中被作为主流交互模式,例如to c 的新一代ai 创作工具flowith 和to b 工作流自动化产品。
Flowith.ai 作为新一代ai 创作工具,其愿景是Craft the ultimate vessel for super intelligence,致力于打造无缝的ai 集成产品。Flowith引入画布借助于ai 完成了低延时的准实时交互,同时也体现了画布设计的关键优势:
a.协助用户完成多线程思维:用户可以进行多个思考分支,实现并行设计,创作和思维拓展
b.视觉化组织:任何内容和工作流设计通过视觉化呈现而非线性或者文本堆叠
c.上下文内容追踪:每个节点关系清晰可见,交互进度克追踪,解决了传统对话中上下文丢失的问题
Gumloop(https://www.gumloop.com)
公司愿景是10倍加速ai 工作流自动化,无代码。作为一个工作流设计系统,cavas 画布成为最核心的交互形式。其交互重点在于,通过视觉化的画布更好呈现了agent 工作流。
Gumloop 同时提供多种主流数据源和数据格式的对接,包括google 办公软件,主流笔记产品notion,slack等协作工具。
图片来自gumloop 官网
AnswerGrid – answer at scale
在搜索和对话交互中提供用户友好的提示语样本
多模式和交互性表格设计- 为每一个表格提供独立代理
对每一个动作按钮进行明确清晰的定义
确保所有相关数据源呈现,这对打造用户信任度非常重要。用户可以信赖agent 通过数据源处理的结果,例如相关的引用和链接等等
在专业领域的ai 产品设计中,对话过程中友好的prompt 提示显得非常重要
以初创公司AnswerGrid 为例,在大批量对话交互中,实时给用户提供提示语(prompt模版)
通过自适应ui 调整来满足个体用户的个性化需求
表格化agent的交互界面,呈现给用户的不仅有agent 结果,也有每一个结果的数据来源:
图片来自Answer grid官网
专业领域界面与通用解决方案不同,趋势是走向高度专业化,增强智能化的人工智能界面,重点从替代转向增强:医疗、金融、教育等行业特定界面,能够增强人类能力的人工智能界面。
与人类并肩工作的协作系统能够理解特定领域词汇和工作流程的定制体验可以快速适应特定专业或个人使用场景的提供智能建议和决策支持的界面ai 代理自主规划于执行:自主规划,任务分解,无限工具调用,自我优化
Hebbia.AI 是一家文档处理公司,给不同行业(金融,法律,大企业)提供文档分析和处理模版,在分析表格为主的界面上实现金融尽职调分析,法律文件分析,企业监管文件分析、PDF 以及音频和视频剪辑,以帮助专业领域的客户处理垂直行业场景的查询和分析
Polymet.AI提供了行业ai 产品设计工具,例如医疗保险行业。在产品设计上考虑交互背后的逻辑,在生成提示的时候保持用户交互持续性,例如在时长过久的时候提示用户10分钟后返回结果。产品生成prompt 的同时提供了不同的设计要素供用户选择。
图片来自Polymet.AI官网
低代码和无代码人工智能集成人工智能界面开发将越来越拉进技术与非技术用户的距离,代码生成的自动化将允许非技术用户自定义创建人工智能界面。典型的交互方式有拖放的人工智能界面构建工具,提供模块化的人工智能组件库。
无代码AI平台通过降低人工智能实施的门槛提供了显著的优势。它们使业务用户、分析师和领域专家能够创建AI驱动的解决方案,而无需深入的技术专业知识。这种民主化可以加速数字化转型,惠及那些可能缺乏资源构建定制AI解决方案的组织和行业。
最好的无代码AI产品在简单性和能力之间取得平衡。它们通常提供直观的可视化界面、预建模板和拖放功能,同时仍然提供访问强大的AI模型和工作流的能力。这种组合允许快速原型设计和部署可以提供真正业务价值的AI解决方案。
非常典型的无代码平台有cursor,瑞典公司lovable等。无代码开发平台+ 底层大模型已经成为许多非技术用户快速开发产品原型和上线的王牌工具组合。
图片来自lovable官网
先进的机器学习模型改进的自然语言处理量子计算的进步增强的神经网络架构改进的传感器和输入技术挑战与考虑尽管ai 交互成为主流并且不断革新,但是在伦理和安全层面还有层层挑战,如何缓解在人工智能系统中的偏见,保持以人为本的设计,最终在伦理合规,数据安全,技术能力和用户体验之间取得平衡是必须持续突破的课题。
预测展望人工智能界面的未来不仅仅在于创造更智能的系统,而是创造更以人为本、更具适应性和情境感知的体验。最成功的界面将是那些能够无缝融入用户生活、理解其独特需求,并在不造成复杂性的情况下提供价值的界面。我们可以预期人工智能界面在下一个十年将实现高度个性化,跨领域和平台的集成,关注增强人类的潜能而非替代。
本文由 @wanlinguo 原创发布于人人都是产品经理。未经作者许可,禁止转载
题图来自Unsplash,基于CC0协议
该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务
来源:人人都是产品经理