武汉大学吴华意教授:面向地学分析AI建模的地理信息服务层次网络模型 |《测绘学报》2024年53卷第11期

B站影视 2024-12-31 09:10 2

摘要:在人工智能生成(AIGC)和大语言模型(LLM)的大背景下,如何提升地学分析模型构建的智能化水平已成为业界广泛关注的焦点。为此,本文提出地理信息服务层次网络模型5-HiNet,基于需求描述、抽象模型、功能模块、服务接口、函数实例的5层子网络结构对海量地学分析模

本文内容来源于《测绘学报》2024年第11期(审图号GS京(2024)2421号)

面向地学分析AI建模的地理信息服务层次网络模型

吴华意

1,2, 赵安琪1, 梁健源,1, 侯树洋1

1.武汉大学测绘遥感信息工程国家重点实验室,湖北 武汉 430072

2.

摘要

在人工智能生成(AIGC)和大语言模型(LLM)的大背景下,如何提升地学分析模型构建的智能化水平已成为业界广泛关注的焦点。为此,本文提出地理信息服务层次网络模型5-HiNet,基于需求描述、抽象模型、功能模块、服务接口、函数实例的5层子网络结构对海量地学分析模型进行建模,由抽象到具体逐层描述地学分析模型的实现过程,固化模型中的知识,形成面向地学分析模型的完备知识体系。5-HiNet模型能够进一步与大语言模型(LLM)进行耦合,实现地学分析模型的智能化生成。本文通过原型系统和应用案例,初步验证了5-HiNet的可行性,并为未来研究和应用提供新的方向和思路。

关键词

地理信息服务地学分析模型层次网络领域知识智能化生成

第一作者:吴华意(1966—),男,教授,研究方向为地理信息服务、分析和挖掘。 E-mail:

通讯作者: 梁健源 E-mail:jliang@whu.edu.cn

本文引用格式

吴华意, 赵安琪, 梁健源, 侯树洋.

WU Huayi, ZHAO Anqi, LIANG Jianyuan, HOU Shuyang.

阅读全文

地学分析模型是理解和揭示地理科学现象、解决复杂地学问题以及综合性决策制定的基本工具[1-3]。伴随着面向服务架构(service-oriented architecture,SOA)的兴起,在地理信息服务的基础上构建地学分析模型的方式已得到广泛认可。依据地学分析知识,用户将一组地理信息服务通过特定流程组合得到一个抽象服务链,也称为组合服务[4-5]。组合服务的本质就是把专家的知识固化到服务链中。将抽象服务链中的处理步骤绑定到服务接口的实例,就形成一个服务链实例。从抽象服务链到服务链实例的过程称为实例化。将服务链实例部署到服务器环境上,根据参数规格输入数据,就可以调用执行,从而得到期望的分析结果。因此,地学分析模型的研究就是围绕构链、绑定、部署、执行等过程开展[6-8]。

在上述框架下,学术界和产业界主要在两个维度上对地学分析模型分别开展研究。第一个维度是地学分析模型的工程实用性维度。伴随云计算、数据中心等架构的发展和应用,如Google earth Engine、PieEngine、OGE、OpenGMS等面向地学分析与建模的云平台和工具得到大力发展[9-12]。这些地理信息服务基础设施不仅提供了前所未有的能力存储和管理海量地理空间数据,还提供了强大的算法库和工具集,简化了地学数据处理、分析和共享的难度,使研究者能够专注于利用已有的地学建模知识构建地学分析模型,实现模型的创新和应用[13-14]。

第二个维度是地学分析模型的应用智能化维度。伴随着地理信息服务基础设施的不断升级,相关研究沿着“手动-半自动-全自动-智能化”的主线逐步发展[15]。目前,研究前沿大致处于半自动阶段,即结合专家经验,使用启发式规则或约束优化等方式,通过人工交互构建地学分析模型[16-19]。为进一步推动地学分析模型的智能化构建,文献[20—21]提出地理信息服务网络(geospatial service web,GSW)的概念模型,将地理信息服务及其复杂多样的关联关系抽象为节点和边,试图建立基于服务网络的学习与推理机制,为地理信息服务组合提供智能化的服务推荐[22-24]。

在复杂网络、知识图谱等建模理论与方法的驱动下,国内外研究学者基于地理信息服务网络的框架开展研究,并取得一些进展。文献[25]根据地理信息服务参数的输入输出关系、服务名称和服务描述的相似关系,构建了基于服务语义的地理信息服务网络,并讨论了其在服务推荐的应用。文献[26]进一步计算地理信息服务网络中服务间的可调用性,并通过赋予连边权重属性表达可调用性的强度。文献[27—28]将地理信息服务与关联数据模型(linked data)相结合,为地理信息数据、处理服务及其组合模型建立明确的链接关系,以促进多源异构的地理信息服务,特别是数据服务的共享与复用。为增强地理信息服务网络中服务关系的表达能力,文献[8]引入了超图模型来描述地表覆盖变化检测服务间的多元关系,并探讨了该模型的更新演化机制及按需服务组合的方法。文献[29]通过融合地理信息服务在服务网络中的结构及语义特征,构建了全面地理信息服务表征,为下游任务提供表征基础。实践证明,构建动态可变、语义关联的地理信息服务网络,是组织海量地理信息服务和提升服务组合能力的有效途径。但是,这些研究还处于为自动化提供辅助信息的阶段,在操作层面仍依赖于用户的交互干预。

多样化的应用场景对地理信息服务组合的智能化提出了更高要求。同时,新一轮Sora、ChatGPT等生成式人工智能(AI-generated content,AIGC)与大型语言模型(large language model,LLM)的发展为地理信息服务智能化提供了新途径[30-31]。然而,LLM通常基于通用语料库训练,将其泛化到专业领域时往往存在局限性,远不能满足地学分析模型构建和应用过程中“自然语言理解”“自动组合”“自主实例化”“可学习、可进化”等新人工智能特征,且会产生“幻觉”现象[32-33]。即当缺乏足够的地学建模知识时,AI系统将难以准确理解地学建模任务的具体要求,选择合适的服务并按照正确的逻辑顺序构建解决方案。因此,如何准确地反映专业领域背后的知识体系,构建地理信息服务AI生成的技术框架,自主地根据用户自然语言描述的需求,自动进行地学分析模型的构建、绑定、部署、执行和结果解析,已成为地理信息领域当前的一项重要研究[34-35]。

为此,本文提出一个面向地学分析AI建模的地理信息服务5层层次网络(5-layer hierarchical network,5-HiNet),用于系统承载先验的地学分析模型专家知识,形成面向地学分析模型的知识体系。该体系能够为LLM提供专业领域知识,进而实现AI生成地学分析模型及其他下游应用。本文基于地学分析模型的样本集,构建一个小领域范围的网络实例,并将其与现有LLM结合,初步验证基于5-HiNet实现地学分析模型自动生成的可行性。

1 地理信息服务层次网络模型:5-HiNet1.1 层次网络模型

层次网络是一种特殊的超网络(super-network)[36-37]。如果子网络间是一种有序的分层关系,相邻层子网络间才有直接的关联关系,超网络就是一个层次网络(hierarchical network)。在层次网络中,当一条边的两个端点属于同一子网络时,表示子网络内部的关联关系;当属于相邻子网络时,表示子网络间的关联关系。不相邻层子网络的关联关系是通过中间的层间接关联的。

1.2 5-HiNet的层次结构

考虑到海量非结构化地学分析知识的组织、承载量、网络的复杂度及知识的服务能力,本文从上到下,按照需求描述、抽象模型、功能模块、服务接口、函数实例来构建地理信息服务5层层次网络(5-HiNet)。5-HiNet的层次主要是沿着SOA架构“查找-绑定-执行”的路径设计的,描述由抽象用户需求到具体模型实现的逐层深化的地学分析模型建模过程。同时,5-HiNet向上扩展到需求描述,方便和自然语言描述的需求对接;中间加入功能模块层次,主要是考虑抽象模型有大量共用和复用的模块,承载了专家共识的粒度适中知识点。5-HiNet的概念框架如图1所示。

图1

图1 5-HiNet的概念框架

Fig.1 Conceptual framework of 5-HiNet

1.2.1 需求描述子网络

需求描述子网络是5-HiNet的访问入口,每个需求描述节点是结构化语义描述的建模需求。每个建模需求包含或者部分包含规范化描述的地学主题、数据源、时空范围、关键词等内容。其中,时间范围通过起始时间、终止时间的“年-月-日”(xxxx-xx-xx)进行统一描述,主题、空间范围、关键词经由专家经验结合地学本体库(如semantic web for earth and environmental terminology(SWEET)、Geo Names等)总结归纳得到。如,“2023年湖北省荆州市的农作物种植面积与2022年比,变化了多少?”是一个自然语言表达的需求,转化为包含“2022-01-01;2023-12-31”“Jinzhou”“crop area”及“change”等内容的结构化描述,这些描述作为1个整体形成了需求描述节点。通过解析需求描述节点可以获取输入输出要求、前提条件、效果、可用资源和关键参数等地学分析模型生成所需的关键信息。此外,依据节点包含的内容和信息,节点之间的关联关系有等效、部分等效、包含、相关等。

1个需求可能有多种地学分析模型解决方案,因此,1个需求描述节点可以对应到下1层的多个抽象模型节点。同时,多个需求可能可以被同1个地学分析模型满足,因此,多个需求描述节点也可能对应到下1层的同1个抽象模型节点。

1.2.2 抽象模型子网络

抽象模型子网络的节点是一系列地学分析抽象模型,边表示不同的抽象模型之间的关联关系。地学分析抽象模型是对地学数据分析过程的抽象表达。每个过程都描述了如何通过特定的算法和分析步骤来处理地理数据,满足具体的地学需求。因此,每个抽象模型节点都代表1个或者1类解决特定地学分析需求的专家知识,并且每个建模需求都是从地学分析模型抽象得到,存在一一对应的关系。由于建模需求间的相似性,每个抽象模型节点可与多个需求描述节点关联。此外,抽象模型间存在满足相同需求或者相似需求、结构相似、包含被包含(1个抽象模型是另1个抽象模型的部分)、使用相同数据源、相同输出类型、调用相同功能模块等关系。

表15-HiNet各层子网络主要关系描述

Tab.1

需求描述子网络需求描述DescReq、主题Theme数据源、DataSource抽象模型子网络抽象模型Abs Model功能模块子网络功能模块Mod Unit服务接口子网络服务接口ServiceInt函数实例子网络函数实例FunctionInst

新窗口打开| 下载CSV

1个抽象模型节点对应到下1层的多个功能模块形成的流程。下1层的多个功能模块节点的组合描述了1个地学分析模型的逻辑结构。

1.2.3 功能模块子网络

功能模块子网络的节点是功能相对单一、粒度适中的抽象子流程,边表示这些子流程之间的传递、包含、相似等关联关系。1个功能模块可能会被1个地学分析模型中多次调用,且不同地学分析模型可能会使用到同1功能模块。1个功能模块是多个服务接口按照某种逻辑组合的流程,因此,1个功能模块节点一般对应到下1层的多个服务接口形成的流程,这个流程描述了这个功能模块的逻辑结构。

1.2.4 服务接口子网络

服务接口子网络的节点是一系列抽象化的服务接口。每个服务接口具有明确的服务边界,规定了可实现的地学操作的职能范围,即基于该接口实现的地学原子函数的功能、输入参数、输出参数和其他要求,但不涉及具体的实现细节。1个服务接口可以拥有1种或多种具体实现方式,因此,1个服务接口节点一般对应到下1层的多个具体的函数实例。

1.2.5 函数实例子网络

函数实例子网络的节点是一个个可以被直接调用的原子函数。每个函数实例都是某个服务接口的具体实现,可以直接调用和执行。1个服务接口可以与多个等效的函数实例绑定,这些函数实例拥有不同服务质量、部署环境、网络链路等,为具体绑定行为的选择与替换提供了可能。

无论是层内关系还是层间关系,节点之间的关系、节点与其属性的关系都可以使用三元组“实体-关系-实体”及“实体-属性-值”表达。从这个意义上说,5-HiNet也是1个复杂的地学建模知识图谱模型。部分可用三元组见表1。

1.3 5-HiNet和通用LLM集成的地学分析模型AI生成框架

按照5-HiNet层次网络的层内与层间多元关系表达,地学分析模型实例可以被解构并汇聚到5-HiNet中。当大规模已经试验证实可靠的地学分析模型被解构到5-HiNet中,5-HiNet越来越接近地学分析知识的完整体系。5-HiNet中的任意链路都代表了建模流程知识,这些建模流程知识就是通用LLM所欠缺的地学分析模型垂直领域知识。理论上,5-HiNet与通用LLM的集成是涌现垂直领域智能的路径,可以有两大基本方案:5-HiNet作为外部知识库的赋能方案和5-HiNet作为领域知识的微调方案。

1.3.1 5-HiNet作为外部知识库的赋能方案

通用LLM在专业领域问答的准确性和针对性极大依赖于提示阶段所植入的知识质量,其推理能力与提示知识的结构性和逻辑性密切相关[38]。5-HiNet作为外部知识库的赋能方案是将5-HiNet作为LLM外部知识源,结合检索增强生成技术(retrieval-augmented generation,RAG)的思想[39],直接检索5-HiNet,为LLM推理提供高质量提示语料,提升LLM生成地学分析模型的能力。

具体而言,对用户描述的地学建模需求,本文方案逐步检索5-HiNet中的层内关系与层间关系,提取出1个流程结构。该结构代表了从地学建模需求到满足需求的地学分析模型的详细实现链路,可为LLM提供1条由抽象到具体的思维导引。因此,本文方案将链路上表达的建模知识整合成提示语料,结合结构模板、思维链等提示方法[40-41],构建提示工程引导LLM进行逐步推理,最终引导LLM生成满足用户需求的地学分析模型。

1.3.2 5-HiNet作为领域知识的微调方案

当通用LLM缺乏足够的领域数据预训练时,其性能一般不能满足领域的应用需求,并产生“幻觉”现象。一种有效的解决方案是使用特定领域数据集对通用LLM进行微调。为此,本方案将5-HiNet作为知识映射工具,结合指令微调(prompt tuning)方法[42],向LLM注入系统化且具有深度的地学建模知识。

5-HiNet作为领域知识微调方案包括两个阶段。第1阶段,利用5-HiNet构建高质量的地学分析建模服务微调数据集。在微调数据集中,每条微调数据由指令、输入和输出3部分组成,分别描述进行的操作、执行指令所需的输入以及根据指令和输入产生的结果。为此,本文方案遍历5-HiNet的节点和边,并依据节点和边构建三元组;接着,三元组中的关系用来定义微调数据的指令部分,而三元组中的头实体和尾实体转化为具体的输入和输出。第2阶段,将构建的微调指令数据集注入通用LLM,可采用prompt tuning、LoRA等参数高效微调方法(parameter-efficient fine tuning,PEFT)对LLM进行微调[43]。相对于传统的全量微调方案,PEFT仅对LLM部分模型权重进行调整,以确保LLM在提升地学分析模型生成任务专业性的同时,仍具备通用的知识理解与推理能力,避免“灾难性遗忘”的出现[44]。

2 实例验证与讨论2.1 系统原型

本文构建了一个初步的地理信息服务层次网络模型原型系统,利用LLM对自然语言文本以及脚本代码的理解与总结能力,并结合其他自然语言处理以及代码理解技术进行知识抽取及规范化,解构和汇聚了500个地学分析模型实例。系统界面如图2所示,包含3个部分:可视化视窗、基本信息及模型检索窗口。当用户在可视化视窗选中1个地学分析模型的节点,或在模型检索窗口进行搜索后,与该地学分析模型相关的节点和边会在可视化视窗高亮显示,节点和边的信息也会展示在基本信息窗口中。

图2

图2 5-HiNet原型系统界面

Fig.2 The user interface of the 5-HiNet prototype system

以原型系统中集成的“滑坡灾害易发性评价模型”为例,该模型基于坡度、植被指数、土地利用类型等评价因子量化滑坡灾害发生的可能性。图3展示了选中滑坡灾害易发性评价模型时的各层子网络中相关节点的可视化高亮效果。在需求描述子网络中,地学主题及其子主题(“自然灾害(Natural Hazzard)”“滑坡(Landslides)”)、数据源(Landsat影像、土地利用覆盖影像及DEM影像)、关键词(土壤侵蚀、植被覆盖等)等信息共同描述了滑坡灾害易发性评价模型的需求描述节点(“需求描述1”节点)。从该节点出发在5-HiNet原型中逐层检索关联节点,抽象模型子网络中的“滑坡灾害易发性评价模型”节点被高亮。在功能模块子网络中,滑坡灾害易发性评价模型包含的重分类、坡度分析、植被覆盖计算,以及栅格叠加计算4个功能模块及其关联关系被高亮显示,这些节点间的边展示了功能模块间的调用关系。这些功能模块通过哪些服务接口组合实现,以及服务接口与具体函数实例的绑定等信息,进一步由服务接口子网络以及函数实例子网络中的节点和边高亮显示。

图3

图3 5-HiNet中滑坡灾害易发性评价模型可视化

Fig.3 The visualization of the landslide susceptibility assessment model in 5-HiNet

2.2 基于5-HiNet的地学分析模型生成案例

为验证5-HiNet与LLM集成实现地学分析模型智能生成的可行性,本文使用5-HiNet作为外部知识库的赋能方案,将5-HiNet原型与千帆大模型ERNIE-Bot 4.0进行整合,实现了1个地学分析模型生成框架,并与直接使用ERNIE-Bot进行滑坡易发性评价模型的生成进行比较,结果如图4所示。

图4

图4 滑坡易发性评价模型构建方案对比

Fig.4 Comparative construction of the landslide susceptibility assessment model

当用户直接向ERNIE-Bot提出“请评估一下某地区发生滑坡的可能性”的问询时,由于ERNIE-Bot缺乏对地学建模领域知识的理解,基本不能生成满足用户需求的地学分析模型。5-HiNet很好地弥补了ERNIE-Bot在领域知识理解上的不足。当该用户问询传入地学分析模型生成框架时,首先被解析为“评估”“滑坡灾害”“可能性”等关键词并向量化表示,并基于语义相似度与需求描述子网络中的节点匹配。系统将候选的需求描述节点作为输入,利用图数据库检索技术自顶向下访问5-HiNet的其他层级,以三元组的方式提取所有关联的节点和边。该三元组集合代表了1个来自5-HiNet的满足用户问询的建模方案的结构化表示。

由于用户问询与多个现有需求描述节点的语义相似度高于预设阈值,系统提取了多个按候选建模方案,并按相似度高低排序。本文选择了相似度最高的方案作为5-HiNet对用户问询的响应结果。候选的知识三元组进一步与预定义的语义模板匹配并生成提示模板,作为ERNIE-Bot的输入。通过这些步骤,用户最终能够获取到1个满足需求的滑坡灾害易发性评价模型的实现方案,如图5所示。

图5

图5 滑坡易发性评价模型生成结果

Fig.5 The results of the development for the landslide susceptibility assessment model

2.3 结果讨论

基于上述原型系统以及与LLM的初步集成,本文认为5-HiNet具备以下4个方面的重要意义。

(1)5-HiNet是基于层次结构实现的网络模型,从5-HiNet中提取出的链路,是抽象到具体、系统性地展示地学分析模型从建模需求到模型实现的完整建模过程。该过程同时体现了“分而治之”的思想,能够降低地学分析建模的复杂性,促成建模知识的理解与复用。

(2)5-HiNet将地学建模知识的整合在统一的知识体系下,汇聚了众源众智的建模知识,并建立了知识间的关联关系,使不同来源的专家知识具备协同工作的潜力。通过遍历5-HiNet的连边关系,将有可能构建出一条模型尚未学习的知识链路,该链路可作为生成满足用户需求的地学分析模型的基础。

(3)将5-HiNet与大模型初步集成的试验结果表明,基于5-HiNet提取子网络并利用其中的节点与连边构建提示工程,能提升LLM在执行复杂地学建模任务时的生成能力。

(4)在5-HiNet中,提取出的链路是先验的、确定性的链路,因此基于该链路生成的地学分析模型具备更强的可解释性。随着越来越多的地学分析模型实例解构到5-HiNet中,5-HiNet预计将在地学分析模型智能化生成任务上发挥更大的价值。

3 难点问题与关键技术

从目前的研究成果看,5-HiNet是地学分析模型智能化构建的基本框架。为更好地发挥5-HiNet的应用价值,需要从不同维度开展更多更深入的研究,突破存在的难点问题和关键技术。

3.1 数据驱动的5-HiNet构建

理论上,5-HiNet的构建有两种工程方法:一种是正向工程,穷尽地学分析类型和机理,对接可用的接口实例,逐步分解形成5层网络;另一种是逆向工程,也是数据驱动的方法,即获取大量众源地学分析模型实例,经机器理解与解析,纳入到5-HiNet中,逐渐丰富5-HiNet,形成知识体系。显然,两种工程方法都是困难的,但是在当前的地理大数据形势下,逆向工程显得更加可行。

考虑到众源地学分析模型来自不同的专家用户,在模型结构、表达方式、运行环境、服务质量等诸多方面存在差异,如何在逆向工程中顾及这些差异,以抽取多维度的建模知识,并梳理知识间的关联关系,将影响到5-HiNet知识表达的准确性和系统性。例如,在功能模块子网络中,需要充分理解地学分析模型的建模流程,将其拆分成若干个子流程,并通过分析不同子流程间的共性和个性差异,对不同的子流程进行概括和总结,才能将其最终转化为功能模块节点。

LLM为基于逆向工程构建5-HiNet提供了1种解决方案。借助提示工程的引导,LLM能够充分利用其强大的语言理解与生成能力,统一解析来自不同建模环境的源代码、元数据和文本描述等,从而弱化由于地学分析模型差异性带来的影响。同时,LLM还能通过理解提示上下文,为5-HiNet各个层级自动抽取相应的节点和边关系,实现建模知识的结构化表达。为确保知识抽取的准确性,需要建立相应的评估体系对5-HiNet进行系统性评价。

3.2 地学建模需求的规范化表达

在5-HiNet中检索地学分析模型,其准确性和效率依赖于对地学建模需求的精确理解和表达。一方面,需要从用户提供的自然语言描述中解码出有关建模需求的语义描述;另一方面,解码后的语义描述需要与建模需求子网络中的节点匹配,才能进一步访问5-HiNet各个子网络层级并提取相关的节点和边。这里有两个方面的挑战。

首先,需要明确地学建模需求的维度和范围,以指导从用户提供的自然语言描述中抽取出哪些建模需求,以及如何结构化描述这些建模需求。为此,1个详细且规范的地学建模需求表达框架是必要的。

其次,需要明确建模需求与地学分析模型之间的关联。1个地学分析模型的建模需求通常由该模型中包含的地学概念、时空范围、数据源、数据精度、控制流结构等内容体现,这些信息隐含在地学分析模型中的不同部分,如何识别、抽取并归纳这些信息,以建立地学分析模型与规范化的地学建模需求之间的关系,也是1个具有挑战性的任务。

3.3 面向5-HiNet的图学习范式

5-HiNet是1个多层次的图结构,包含丰富的图结构信息和特性。将图结构数据融合到LLM中,本文方案是将图结构数据转化为自然语言描述,通过纯文本提示进行图结构建模,并在此基础上进行指令微调。然而,该方案会导致LLM在处理更为复杂的推理时存在困难[45]。因此,需要深入研究图学习范式,将图的结构信息与语言空间进行对齐,克服使用纯文本提示建模图结构的局限性[46]。确保在进行领域微调时,LLM能够同时理解图的结构和语义信息,高效集成5-HiNet的领域知识,并获得依据复杂关系和属性进行逐步推理的能力。

3.4 5-HiNet和图大模型

LLM通过在语言空间中训练和学习得到强大的知识表达和推理能力,其本质仍是语言模型。针对图结构数据的特点,业界已提出图大模型(large graph model)的概念[47],旨在基于海量图数据集进行预训练,为图结构数据提供通用的基础模型。该模型能够理解图上下文,包括节点、边、子图和整个图的信息,并具备强大的泛化能力。本文提出的5-HiNet是多层次、结构化的图结构模型,固化了大量从地学分析模型实例中得到的建模知识,这些知识通过节点之间的关联表达。与此同时,5-HiNet为不同地学分析模型、功能模块、地理信息服务都建立了关联关系。5-HiNet形成潜空间(latent space)实际上包含了几乎所有满足用户需求的解,即实际上所有的地学分析模型构建方案都已经潜藏在5-HiNet的图结构中。然而,这些方案难以通过传统的图深度学习模型得到。鉴于此,图大模型是1个具有潜力的解决方案。由于图大模型尚未实际形成,如何构建图大模型,甚至是否能以5-HiNet为基础构建图大模型,是极具挑战的课题。

4 总结与展望

随着GEE、PieEngine、OGE等部署在云环境中的由数据、算力、服务、注册用户构建的开放地理信息服务生态形成和完善,AI生成地学分析模型的需求和条件越来越成熟。本文提出了一种面向地学分析AI建模的地理信息服务层次网络5-HiNet,该网络为地学分析模型构建了从需求到实例的统一表达视图。本文进一步提出了5-HiNet和LLM的集成框架,为LLM提供专业领域知识,进而实现AI生成地学分析模型及其他下游应用。本文基于地学分析模型的样本集,构建了1个小领域范围的网络实例,并将其与现有LLM结合,初步验证了基于5-HiNet实现地学分析模型自动生成的可行性。

除了本文提出的可以进一步研究的难点问题和关键技术外,未来的研究工作还可以从以下3个方面展开:①进一步深化5-HiNet的关系表达,拓展服务间关系的类型和维度,更准确地描绘地学分析模型中服务组合的动态性和复杂性;②不断拓展5-HiNet的规模,并持续关注AIGC、LLM等技术的更新迭代,完善5-HiNet与相关技术的集成方案,推动地学分析模型智能化生成的发展;③通过5-HiNet降低专业领域的门槛,促进不同领域间的交叉合作与知识共享,最终推动地理科学领域乃至相关行业的整体发展。

来源:测绘学报

相关推荐