摘要:随着技术的不断发展,我们正日益接近通过先进技术将人们与信息更紧密地连接在一起。聊天机器人和虚拟助理已成为消费者、员工和患者等获取知识的重要门户。最有效的聊天机器人不仅能通过机器学习和允许自然语言提问的直观界面提升用户体验,还能成为访问组织知识库的重要入口。
随着技术的不断发展,我们正日益接近通过先进技术将人们与信息更紧密地连接在一起。聊天机器人和虚拟助理已成为消费者、员工和患者等获取知识的重要门户。最有效的聊天机器人不仅能通过机器学习和允许自然语言提问的直观界面提升用户体验,还能成为访问组织知识库的重要入口。
然而,这一切的前提是坚实的信息架构基础。
需要先进技术只是难题的一小部分。在Baklib,我们收到很多人在部署这些类型的先进技术失败后给我们打电话,尽管他们拥有优秀的开发人员。缺乏信息战略(基础)是他们的阻碍。
本文我们将使用分类法、人工智能和聊天机器人作为框架,解释分类法和本体中信息策略的重要性,以使人工智能驱动的聊天机器人发挥最佳性能。
1.关于分类法,我们在其他地方也聊到了分类法相关内容:
分类法在内容发布工作流中的作用
从混乱到清晰:内容分类和信息架构最佳实践
2. 关于信息架构,这个我们聊得是比较多的
信息架构( IA )的信息理论-第1部分
信息架构(IA)的信息理论-第2部分
每个企业都应该了解的6个关于信息架构重要的事
基于信息架构的网站建设理论与实践-Baklib
基于IA信息架构的知识库理论和实践 - Baklib
人工智能、聊天机器人、分类法之间的关联
人工智能、聊天机器人与分类法之间有着天然的联系。分类法是数据组织的基础,决定了信息如何被结构化、索引和访问。
当信息按照分类法进行结构化和索引时,用户可以更轻松地通过层级深入到具体类别、向上查找更广泛的主题,或者横向探索相关主题。
对用户有利的事情也同样对 AI 有利。通过结构化数据,可以缩短 AI 项目价值实现的时间,并让企业更快地从技术投资中获得回报。
分类法和更复杂的本体(ontology)能支持和推动 AI 技术的应用。组织从人工智能驱动的聊天机器人中获得的好处,往往取决于所用数据的质量。数据越结构化、质量越高,AI 就能更好地理解和利用这些信息,提供准确的答案与建议。
反之,数据不完整、错误或有偏见时,AI 的表现将不尽如人意,甚至可能对品牌形象产生负面影响。因此,组织应着重于确保数据的高质量和一致性,以保证 AI 系统的成功运行。
分类法简史:Berrypicking 模型
1989 年,信息学家 Marcia Bates 提出了“Berrypicking”模型,指出了信息检索行为中的关键要素,尤其是如何应对动态变化的查询。这一模型成为了解决信息查找问题的重要基础。
在线搜索界面的浏览和BERRYPICKING技术设计。
Marcia J.版权所有©1989。贝茨
贝茨指出:
搜索查询通常是动态变化的,而非静态的。
用户往往会以零碎的方式收集信息,而非通过一组最佳检索信息。
用户会使用多种检索技术,跨越书目数据库以外的其他资源。
查询会随着用户对信息的理解不断变化。
这一思路为构建更智能、更灵活的人工智能搜索系统提供了重要启示。
实际应用:从 AI 驱动聊天机器人到智能信息架构(IA)
最近,Baklib 与众多开发人员和人工智能工程师合作,共同打造 AI 驱动的聊天机器人。尽管这类项目看似复杂,但我们的团队凭借成熟的信息架构方法,发现这一过程并不那么陌生。我们已经准备好重新评估并调整我们的方法,但对于方法的持久性和适应性感到惊讶。
我们的经验表明,尽管 AI 项目在技术实施上复杂,但理解用户需求、内容可用性、法律和安全问题等关键方面,对于聊天机器人系统的成功同样至关重要。
5 个关键要素:每个聊天机器人都应考虑的内容
在评估 AI 驱动的聊天机器人时,我们发现以下几个领域对于系统的设计至关重要:
同义词、同音词、反义词等:确保系统能够理解并处理语言的多样性。
查询消歧:例如区分“土耳其”动物与“土耳其”国家。
查询扩展/细化:例如,将“Terrier”拓展为“Dog”。
跨域关系识别:例如,从“狗”推导出“治疗辅助工具”。
AI 训练与规则、实体提取:确保 AI 系统能根据规则提取相关信息。
通过这些要素的精确评估,能够帮助我们确定聊天机器人所需的资源和能力,确保信息架构支持的功能完整性。
需求收集
每个项目都应该做到需求收集并汇总后进行需求评估,下图是需求收集的类型与流程:
分类法构建输入
评估之后,我们转而关注聊天机器人需要什么样的资源。企业分类项目有许多组件,包括治理、维护、系统集成等。对于像聊天机器人这样以查询为中心的项目,可以使用许多来源,包括:
从在线和文档内容中提取实体结果
审查搜索日志
支持团队记录的用户问题
行业标准分类法和术语
公开可用的支持文档
用户研究
本体工具培训和文档
获取分类法
聊天机器人有很多功能,但我们专注于那些可以通过分类/本体支持的功能。一旦我们将聊天机器人和本体功能列表并排放置,很明显聊天机器人功能在几乎所有可查找性项目中都很常见。认识到这一点有助于鼓励我们坚持基本原则。
聊天机器人的分类功能
同义词、同音词、反义词等。
查询消歧(即“土耳其”动物与“土耳其”国家)
查询扩展/细化(即“Terrier”→ Dog)
识别跨领域的关系(即狗→治疗辅助工具)
AI训练和规则、实体提取
Baklib 有幸极其聪明且以信息为中心的工程师团队合作,这使得人工智能组件不再那么令人畏惧。我们不需要非常努力地让人们相信不同类型的词条(同义词、反义词、昵称等)的价值。当开发人员努力寻找与动词交互的最佳方式时,我们可以为他们构建一个“动词”分类法。
在下面,您可以看到依赖本体的功能(黄色)在那里。
最终思考:将信息架构作为 AI 成功的关键
从宏观角度来看,糟糕的数据质量每年给美国行业带来的损失数以万亿美元计,给组织带来的损失也可达到数百万美元。差劲的信息架构和分类法实践不仅会拖慢数字化进程,还会让员工感到沮丧,并促使客户转向竞争对手。
因此,为了确保 AI 驱动的项目能够成功实施,企业需要:
始终聚焦最终用户的目标:我们所构建的分类法和本体模型必须服务于用户需求,才能实现最大的商业价值。
将智能搜索视为多功能工具:不仅仅是一个查询系统,而是一个多维度知识管理平台。
投资强大的信息架构:优秀的信息架构设计可以确保系统具备高质量的数据支持,而不仅仅依赖 AI 技术本身。
通过信任信息架构的基本原则,并将这些原则与先进的 AI 技术结合,企业能够更好地解决信息检索中的问题,提升用户满意度,并确保品牌在未来技术环境中的竞争力。
来源:成都探码科技