摘要:国家知识产权局信息显示,北京长河数智科技有限责任公司申请一项名为“一种基于大语言模型及向量库构建知识图谱的方法”的专利,公开号 CN 119129722 A,申请日期为 2024年8月。
金融界2024年12月18日消息,国家知识产权局信息显示,北京长河数智科技有限责任公司申请一项名为“一种基于大语言模型及向量库构建知识图谱的方法”的专利,公开号 CN 119129722 A,申请日期为 2024年8月。
专利摘要显示,本申请公开了一种基于大语言模型及向量库构建知识图谱的方法,涉及知识图谱技术领域,包括:对采集的自然语言文本,利用预训练的RoBERTa模型进行分词、词性标注和语义解析处理,得到自然语言文本的语义表示向量;通过Seq2Seq框架及注意力机制,获取语义表示向量与对应的命名实体之间的关联,通过得到的关联获取命名实体;构建知识图谱;构建的知识图谱与预设领域的关系数据库进行融合,生成融合知识图谱;利用依存句法分析获取出命名实体及对应的属性,获取命名实体的实体关系,构建融合知识图谱的命名实体、属性和实体关系的结构化三元组。针对现有技术中实体链接难度大的问题,本申请将知识图谱转化为低维稠密向量表示,并构建倒排索引库等,降低难度。
来源:金融界
免责声明:本站系转载,并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题,请在30日内与本站联系,我们将在第一时间删除内容!