人工智能和知识图谱七:知识图谱在人工智能系统中的优势

B站影视 韩国电影 2025-06-09 10:00 2

摘要:知识图谱融入AI解决方案后,将带来诸多优势。这些优势涵盖互操作性、查询功能等技术改进以及可解释性、可信度、减少开发工作量等更高层次的关注点。本文概述了知识图谱的主要优势,以及它如何补充机器学习模型,助力打造更值得信赖的 AI。

知识图谱融入 AI 解决方案后,将带来诸多优势。这些优势涵盖互操作性、查询功能等技术改进以及可解释性、可信度、减少开发工作量等更高层次的关注点。本文概述了知识图谱的主要优势,以及它如何补充机器学习模型,助力打造更值得信赖的 AI。

数据互操作性和集成:知识图谱 (KG) 的优势在于通过提供通用语义层来统一来自不同来源的数据。使用共享标识符和本体,知识图谱可以连接以前孤立的数据——例如,将 CRM 中的客户资料与其在财务系统中的交易以及其在服务台的支持工单关联起来。互操作性源于遵循标准(例如 RDF、schema.org 或领域本体)并使用全局标识符(例如 RDF 中的 URL 或 IRI),从而使不同的数据集“使用同一种语言”。这意味着,只要创建到本体的映射,就可以以相对较低的摩擦将新的数据源插入到知识图谱中。其好处是,组织可以全面查询所有数据,而无需手动关联数据库之间的 ID。它有助于对核心业务实体(客户、产品等)进行全方位的了解。由于许多知识图谱使用 Web 标准,集成甚至延伸到组织外部——链接到 Wikidata 等外部知识图谱以获取更多上下文,或通过共享词汇表链接到合作伙伴数据。本质上,知识图谱充当数据结构或语义数据湖,其中所有内容都相互连接且可发现。这大大减少了在开发 AI 模型或进行分析时花费在数据整理上的时间,因为关系已预先集成在知识图谱中。正如艾伦·图灵研究所所言,知识图谱“方便访问和集成数据源”。

富有表现力且灵活的查询:与受限于预定义表连接的关系数据库不同,知识图谱支持复杂且临时的查询,这些查询反映了人类对关系的思考方式。想要找到像“过去两年内涉及召回的零件供应商”或“通过第三方间接合作的作者”这样的模式吗?在知识图谱中,这些多跳、有时模式灵活的查询通常可以用单个 SPARQL 或 Cypher 查询来表达。这种任意遍历且不需要严格模式对齐的能力是一大优势。图查询可以遵循未知长度的路径,处理可选关系,并且可以轻松地融入本体推理,例如,包含查询要求“车辆”的结果,而知识图谱可以返回轿车、卡车等,因为知道它们是车辆的子类。因此,分析师和人工智能系统可以提出更丰富的问题。例如,推荐引擎可以查询“给我这个用户的朋友的朋友,他们喜欢 X 类别的产品”,以获得更广泛的推荐基础。或者,分析师可以查询文献知识图谱“查找引用了与主题 B 论文共同的论文的主题 A 的论文”,以识别跨学科影响。因此,知识图谱充当强大的可查询知识库,通常支持全文搜索或与语义条件集成的地理空间查询等功能。灵活性还意味着数据模型可以在没有痛苦的模式迁移的情况下发展——可以在不破坏现有查询的情况下将新的实体类型或关系添加到图谱中,这在动态环境中非常重要。传统数据库在这里举步维艰,而知识图谱则能优雅地适应。

可解释性和透明度:知识图谱 (KG) 的一大优势在于它能够增强 AI 的可解释性。当 AI 系统使用知识图谱时,它可以将其输出追溯到该图谱中的特定事实和路径。这意味着决策可以用人类可理解的术语来解释,参考现实世界的实体和关系,而不是晦涩难懂的模型权重。例如,假设一个 AI 推荐一种治疗方法——如果它由知识图谱支持,它可能会给出这样的结论:“推荐治疗方法 X,因为患者患有病情 Y,并且根据指南 Z,治疗方法 X 适用于 Y,并且有证据表明该方法对具有生物标志物 W 的患者有效”——这些部分(病情、指南、生物标志物)都是知识图谱中通过已知关系连接起来的节点。这种可检查性对于信任至关重要:用户和利益相关者可以审核 AI 是如何得出结论的 。

福布斯科技委员会指出,知识图谱将成为使 AI 系统更易于解释、更易于审核并最终更易于控制的关键要素。此外,知识图谱 (KG) 提供出处信息 (Progression),由于每个事实都可以链接到一个来源或证据节点,人工智能的断言可以追溯到原始数据或参考文献,从而满足受监管行业对信息来源的了解需求。在知识图谱中,出处可能是一条类似于“assertedInStudy”的边,将某个声明链接到某个出版物的 DOI。这在一定程度上增强了人工智能的可信度和可问责性——如果结果错误,人们可以排查是哪部分知识导致了错误,可能是知识图谱中某个过时或有偏见的事实。对于黑盒机器学习来说,这要困难得多。因此,知识图谱通过明确推理链,为值得信赖的人工智能做出了贡献。正如一位消息人士所强调的那样,知识图谱使人工智能的输出对每个人都透明且易于解释,用户无需拥有机器学习博士学位即可理解答案的来源。

减少对训练数据的需求(小样本学习):机器学习模型,尤其是深度学习,通常需要大量的带标签数据。然而,知识图谱编码了一般知识,可以帮助模型用更少的样本执行任务。这是因为模型可以依赖知识图谱获取事实或常识性信息,而不是从训练数据中的模式中学习。例如,如果聊天机器人在被问到某个事实时可以直接向知识图谱查询,那么它可能不需要数百个关于该事实的示例。在计算机视觉领域,概念知识图谱可以帮助进行零样本分类:例如,如果一个模型从未见过“霍加狓”,但通过知识图谱知道霍加狓是一种有斑马条纹的有蹄类动物,那么它可以推断出它的某些属性并通过相关特征识别它。在自然语言处理(NLP)领域,通过注入知识图谱事实,而不是寄希望于答案出现在训练文本中,问答等任务的性能得到了显著提升。艾伦·图灵研究所指出,知识图谱减少了对大型带标签数据集的需求,并促进了迁移学习 。本质上,知识图谱提供了一种背景知识,模型无需从数据中学习,从而提高了数据效率。尤其是在医疗、法律等标注数据稀缺的专业领域,拥有专家构建的知识图谱可以弥补这一缺口,使模型能够在有限的微调下运行。这对于规模较小的组织或资源匮乏的环境来说是一个好处,因为在这些环境中,收集大数据是不可行的——他们可以利用现有的知识图谱(例如维基数据或领域本体)来增强人工智能系统。

符号 AI 与统计 AI 的结合:知识图谱提供了一条通往神经符号 AI的途径,将符号推理(精确、基于逻辑)与统计学习(数据驱动、概率)相结合。其优势在于兼顾两全其美:符号系统的稳健性和先验知识,以及统计系统的灵活性和模式识别能力。例如,AI 助手可以使用神经网络将用户的问题解析为意图,然后以符号方式使用知识图谱来实现该意图(通过逻辑检索答案或基于事实进行推理)。这种结合可以减少幻觉,因为知识图谱充当了事实核查或对真相的硬记忆。事实上,最近的研究正在使用知识图谱来缓解大型语言模型 (LLM) 的幻觉,方法是强制模型将其响应的某些部分基于检索到的知识图谱事实。另一方面,机器学习可以通过链接预测或自然语言处理 (NLP) 提取来填补知识图谱中的空白,从而解决知识图谱的不完整性问题。这种协同作用意味着更强大的人工智能:一篇2025年的系统综述指出,知识图谱和大语言模型“对于提升人工智能的理解、推理和语言处理能力至关重要”,并强调了这种相互作用。因此,知识图谱通过提供机器学习所缺乏的——显性知识、一致性和推理能力——来补充机器学习,从而使整个系统更加高效和可信。正因如此,科技公司纷纷投资于这样的系统:知识图谱可以生成候选答案,机器学习模型对其进行排序;或者机器学习生成假设,知识图谱对其进行验证。

复杂查询支持与推理:知识图谱 (KG) 能够执行复杂的查询和推理,而这些查询和推理对于关系数据库或纯机器学习 (ML) 来说极其困难。例如,语义推理:从“大张是小张的姐姐”和“小张是张明的父亲”,知识图谱推理器可以通过本体规则自动推断出“大张是张明的阿姨”。这种推断新知识的能力是一个巨大的优势——图谱不仅仅包含给定的事实,还可以扩展到隐含的事实,从而丰富 AI 可用的知识。它还能确保一致性——如果本体论认为没有人可以有两个出生日期,那么知识图谱推理器可以检测到机器学习模型无法察觉的矛盾之处。对于法律或医学等行业而言,这种逻辑一致的推理至关重要。知识图谱允许以正式的方式对约束和业务规则进行编码,确保 AI 决策遵守这些规则。例如,贷款审批人工智能可能会使用知识图谱 (KG) 来确保其不违反监管规则(规则编码在本体或规则库中,任何违反规则的决策路径都会被推理器标记)。因此,知识图谱在人工智能治理中发挥着作用:通过将策略和领域知识注入决策过程,它们有助于避免不可接受的结果(例如,医疗人工智能建议一种明显禁忌的治疗方法——如果知识图谱了解药物相互作用,人工智能就可以避免这种情况)。更多资讯白皮书点击下载https://www.casicloud.com/typicalcase/knowledge_planet?id=809

来源:工业互联网观察

相关推荐