大模型和知识图谱双轮驱动的汽车制造业知识服务

B站影视 港台电影 2025-04-05 09:00 1

摘要:汽车制造业企业通常有着非常多的部门,生产销售包含很多环节,各个环节都会产生大量数据,有些是信息化系统产生的结构化数据,还有一些是报告、文档等非结构化数据。其中非结构化数据往往分散于员工设备中,难以整体管控,文档之间的关联度较低,要将其中的知识进行关联会非常困难

导读本文将分享汽车制造业领域大模型与知识图谱结合的应用实践。

主要包括以下五部分内容:

1. 汽车制造业知识库现状

2. 大模型+知识图谱技术原理

3. 大模型+知识图谱双擎的应用场景

4. 大模型+知识图谱应用实践案例

5. Q&A

分享嘉宾|杨成彪博士 柯基数据 CTO

编辑整理|王红雨

内容校对|李瑶

出品社区|DataFun

01

汽车制造业知识库现状

很早以前,汽车制造业就已开始应用知识库相关产品,其核心目的是解决企业知识管理的问题。

汽车制造业企业通常有着非常多的部门,生产销售包含很多环节,各个环节都会产生大量数据,有些是信息化系统产生的结构化数据,还有一些是报告、文档等非结构化数据。其中非结构化数据往往分散于员工设备中,难以整体管控,文档之间的关联度较低,要将其中的知识进行关联会非常困难,也会带来巨大的运维成本,因此知识大多是离散的,这对企业的知识积累非常不利。

因此企业需要知识库来解决上述问题,而知识库的形式也经过了几代的演进。

传统知识库:采用纸质文档,存储于档案室中,维护和使用效率极低。数字知识库:随着互联网技术的兴起,企业构建了知识管理系统,比如企业内部 wiki,文档开始已数字化形式保存。但这种形式下存在知识孤岛,知识间缺乏联动。智能知识库 1.0:到了智能化时代,以知识图谱技术为核心搭建了新一代知识库。通过半自动化构建知识图谱,核心是文档标签化,深入的可做到段落级标签,浅的仅为文档级标签,从而形成知识库级的知识网络。基于此网络可进行搜索、推荐、人员培训等。不过,该阶段知识图谱构建成本高,基于传统深度学习技术构建知识图谱需训练大量知识抽取模型,且在专业技术领域还需在企业内部微调,否则质量较差,需更多人员确认和维护抽取数据;若不通过模型,就需文档所有者或管理者手动编辑确认文档标签,运维成本高。智能知识库 2.0:进入大模型时代,在新的架构下,要保持将知识细化、串联知识点的优点,还要降低人工运维和知识抽取模型训练的成本;同时提升智能化体验,通过搜索、问答、推荐等多种形式,让用户可以更快地找到知识;在此基础上,能够更好地积累知识,让各种形式的数据,如视频、图片、文档、结构化数据等,都可以为用户创造价值;并且让知识在多种应用场景中流动起来,为企业实际生产经营提供服务,进一步提升知识的价值。

基于上述知识库发展背景,我们研制了面向汽车制造业的智能知识库 2.0 产品,其核心是解决全栈知识管理,融入最新的AI技术,为高效、便捷的知识管理提供支撑。

对于汽车制造业这种知识高度专业、技术点庞杂的场景,仅依靠大语言模型是不够的,还需知识图谱辅助,接下来将详细阐述原因。

02

大模型+知识图谱技术原理

首先需要了解一下双系统认知理论(DPT)。

人脑决策存在两个系统,系统一凭直觉快速决策,负责约 95% 的日常决策;系统二负责剩下的 5%,即缓慢的需深度推理的决策,如解复杂数学题等。当前深度学习和大语言模型主要在实现系统一的功能,而要实现真正的人工智能需要研究如何实现系统二。

符号主义与连接主义是人工智能两大流派:

符号主义:将知识符号化,基于符号化的知识实现智能。以知识图谱为代表,将知识通过三元组形式显式表示,构建巨大的知识网络,实现知识推理和分析,从而达成人工智能。然而知识图谱也存在规模的局限性,覆盖面有限,并且语义理解上相对匮乏。连接主义:基于神经网络,大语言模型是其集大成者。知识隐性存储在神经网络参数中,是不可读的,通过合适的提示词唤醒,并输出。这种方式虽更占上风,但存在知识不可编辑、不可确认、运维复杂等问题。如果存在错误,只能通过微调或外挂等打补丁的方式进行知识调整,而这些调整是难以确保有效的,只有反复实验才能验证,而调整的同时是否对其它知识造成了破坏也是无法确定的。

知识图谱与大语言模型各有优劣,二者结合则可产生更强的特性。

如上图中的示例,大模型可能存在幻觉问题,给出错误的回答。而加入知识增强后,效果可以得到显著提升。

解决大模型幻觉问题的一个方向就是 GraphRAG,即基于知识图谱提升大语言模型的知识问答表现。相比常规大语言模型问答,以及 RAG(知识文档分片外挂存储,检索知识点辅助回答),GraphRAG 将外挂知识构建成知识网络,以知识点而非文本片段检索,回答更全面。

从 2024 年 4 月,微软发布 GraphRAG 并开源之后,GraphRAG 技术经历了非常快速的发展。微软 GraphRAG 的数据处理包含知识图谱构建、图谱摘要、社区发现及社区摘要生成四个步骤,每一步都是利用大模型完成的。其回答模式包括本地搜索(常规 RAG 问题,具体的知识点)和全局搜索(宏观问题)。随后的改进版本 Nano-GraphRAG,对代码进行了精简,更利于商业化开发。

国内,阿里于 9 月发布了 KAG,更好地发挥了知识图谱的价值。之后,港大发布了 LightRAG,兼顾了效率与成本。

11 月微软又发布了新的工作 LazyGraphRAG,精简了数据处理阶段,不调用大模型,使得数据预处理速度得到了大幅提升,同时成本大幅降低。另外,也实现了动态的知识维护。

综上可以看到,GraphRAG 的发展趋势为:

知识图谱构建采用动态、多层级的方式。GraphRAG 与 RAG 双向奔赴,相互折中。更好的利用已有图谱,包括企业内部构建的,和外部开源的资源。

我们自研的 GraphRAG 首先要解决的问题就是充分利用现有知识图谱。第二是通过知识图谱理解用户意图,拆解问题,以更好地检索知识。

如上图所示,用户提问后,提取实体并进行拓展,在知识层面上基于知识图谱进行推理,转写意图后再进行 RAG 流程。

我们构建了大语言模型加知识图谱相互增强的双擎架构,大语言模型辅助知识图谱构建,知识图谱增强大语言模型表现。

以看病的场景为例,结合疾病知识图谱和大语言模型交互理解的能力,大语言模型在知识图谱中推理查找,将用户症状与知识点对齐,实现疾病筛查和初步确诊,比单纯大语言模型更加准确。

03

大模型+知识图谱双擎的应用场景

接下来介绍大模型结合知识图谱的应用场景。

构建企业级的知识库,将知识融会贯通形成一个大的网络后,从业务全生命周期的各个阶段都可以受益。

我们打造的汽车制造业知识服务中台,汇聚了各个部门、各种流程中的知识,通过知识图谱将知识有机整合,从研发设计到售后服务的整个过程中,知识点始终保持对齐,使各环节的智能化都有所提升。下面将对一些典型场景进行介绍。

首先,在研发场景中,主要包括研究发现和研发设计两大部分。研究发现,即基于当前的研究进展找到一些可以满足业务需求的技术点,这一过程中需要对内外部知识进行整合。研发设计方面,主要需要对设计图纸进行管理,我们实现了自动解析设计文件,从中提取知识点并形成关联,这样就可以在文件层面进行智能搜索和智能问答。

在生产场景中,需要对设备故障进行诊断。将设备手册与故障报告积累于知识库后,运维人员可以通过问答形式快速定位和解决问题,提高了响应效率。

售前的一大场景是订单智能分析。对于非标产品,订单描述可能非常复杂。利用大语言模型,可精准理解定制化需求,匹配内部产品规格,并进行兼容性检查,最后将整合后的方案提供给用户,用于进一步的沟通。

售前的另一大场景是提供技术支持。专业技术人员提供售前支持成本高昂。利用大模型+知识图谱,可以为销售提供售前技术支持,并且可以打破语言限制,实现多语言服务,减轻人工负担。

售后智能客服是一个非常常见的场景,结合知识库与大模型,可以扩展 FAQ 之外的服务范围,提升客户服务满意度。

04

大模型+知识图谱应用实践案例

下面来分享一些实践案例。

第一个案例是某车企生产设备知识图谱,汇总了所有故障现象与原理,使维修人员可以快速进行故障排查,提升问题解决效率。

第二个案例是企业设备运维助手,将产品手册与常见故障手册汇总到一起,形成了知识图谱增强的大模型问答系统,从而为各种设备运维问题提供全面而准确的回答。

最后一个案例是为某全球化汽车技术供应商做的一个辅助研发的 AI 助手,可以根据需求辅助技术选型,还可以根据核心参数评估最优方案。其背后通过多 Agent 支持不同工作,相互配合,最终完成用户诉求。基于 PDCA 架构,知识库随使用反馈调整动态更新,实现了能力的持续提升。

05

Q&A

Q1:如何有效地将 300 多份规章制度文件转化为易于使用的问答系统?

A1:首选尝试常规 RAG 的方法;若遇到复杂细节询问,则构建知识图谱,梳理概念框架,定义关系,利用大模型自动拆解规则,进行图谱构建,以回答复杂问题。

Q2:PPT 中提及的风险识别是如何操作的?

A2:例如在采购电梯主板时,确保与电源适配性符合规定,通过构建知识图谱导入产品手册规格,检测设备兼容性,可以提前识别风险,供销售人员审核。

Q3:医疗场景下,基于图谱的多轮问答,next question 如何确定?

A3:明确目标,让大模型基于知识库引导用户对话直至确定具体疾病或症状,基于症状挖掘和统计选择具有代表性的提问,设定交互框架并在知识图谱基础上进行统计分析,制定下一步问题。需要说明的是,在很多场景中仅通过语言交互是非常低效的,在手机上直接提示几个选项让用户选,比一个个问要高效得多。

以上就是本次分享的内容,谢谢大家。

来源:DataFunTalk

相关推荐