摘要:本次给大家带来一篇SCI论文的全文翻译!该论文引入了一种基于空间依赖的图神经网络(GNN)方法,并探讨空间结构与城市尺度上恢复质量之间的关系。该论文阐明了空间结构与恢复质量之间的关联,为未来提升城市居民的福祉提供了新的视角。
本次给大家带来一篇SCI论文的全文翻译!该论文引入了一种基于空间依赖的图神经网络(GNN)方法,并探讨空间结构与城市尺度上恢复质量之间的关系。该论文阐明了空间结构与恢复质量之间的关联,为未来提升城市居民的福祉提供了新的视角。
【论文题目】
How does spatial structure affect psychological restoration A method based on graph neural networks and street view imagery
【题目翻译】空间结构如何影响心理恢复?一种基于图神经网络和街景图像的方法
【期刊信息】Landscape and Urban Planning, Volume 251, November 2024, 105171
【作者信息】Haoran Ma,香港中文大学空间与地球信息科学研究所,6210307146@stu.jiangnan.edu.cn;Yan Zhang,香港中文大学空间与地球信息科学研究所,6210307146@stu.jiangnan.edu.cn;Pengyuan Liu,全球未来城市实验室,新加坡- eth中心,pengyuan.liu@sec.ethz.ch;Fan Zhang,北京大学地球与空间科学学院遥感与地理信息系统研究所,fanzhanggis@pku.edu.cn;Pengyu Zhu,香港科技大学公共政策学系,pengyuzhu@ust.hk。
【论文链接】https://doi.org/10.1016/j.landurbplan.2024.105171
【关键词】恢复、图神经网络、街景图像、空间结构、GeoAI、注意力恢复理论。
【摘要】
注意力恢复理论(ART)提出了四个关键指标(远离、广度、吸引力和兼容性)用于理解城市和自然环境的恢复质量。然而,以往的研究大多依赖于孤立的问卷调查或图像分析,忽略了空间结构(场景实体之间的视觉关系)和邻近环境对恢复质量的影响。本研究引入了一种基于空间依赖的图神经网络(GNN)方法,旨在填补这一空白,并探讨空间结构与城市尺度上恢复质量之间的关系。我们构建了两种类型的图:一种是利用连续的街景图像(SVI)构建的街道级别图,用于捕捉实体之间的视觉关系并表示空间结构;另一种是通过建模道路的拓扑关系来捕捉邻近实体的空间特征的城市级别图。这两种图整合了感知、空间和社会经济特征,用来衡量恢复质量。研究结果表明,空间依赖的GNN模型优于传统模型,取得了0.742的准确率(Acc)和0.740的F1分数,显示了其在捕捉邻近空间特征方面的卓越能力。消融实验进一步揭示了空间结构特征对恢复质量预测性能的显著积极影响。此外,研究还强调了相较于人工实体(如建筑物),自然相关实体(如树木)对高恢复质量的重要性。本研究阐明了空间结构与恢复质量之间的关联,为未来提升城市居民的福祉提供了新的视角。
【前言】
全球超过一半的人口居住在城市中,而这一数字处于不断变化的状态,预计到2050年,这一比例将增加至全球人口的75% (Ritchie and Roser, 2018)。这种快速的城市化进程迫使我们必须关注缓解城市环境对人类健康的不利影响,特别是在促进身体健康、管理压力以及预防压力相关疾病方面 (Akpınar, 2021; Cetin et al., 2021; Liu et al., 2020)。改善城市建设环境是一个被广泛认可的解决方案,其潜力被认为可以应对这些心理健康问题 (UNFPA, 2007; Keniger et al., 2013; Hough, 2014)。
与此同时,接触森林和绿地对人类心理健康的益处已得到证实,能够有效减少压力 (Capaldi et al., 2014),改善情绪 (Berman et al., 2008),并恢复耗竭的认知功能 (Akpınar, 2021; Liu et al., 2020),这些都得到了注意力恢复理论(ART)的支持(Kaplan, 1995; Hartig et al., 1991)。然而,以往的实证研究通常依赖孤立的问卷调查或单一图像作为评估方法和数据来源 (Burmil et al., 1999; Lindal and Hartig, 2013)。这种方法未能考虑空间结构(即场景内的连接)和地理相关性(即场景外的影响)对恢复质量的影响。因此,这些研究得出的结论和实证证据可能是有限且孤立的。因此,有必要研究这些影响,以全面理解恢复性环境。
空间结构,被理解为物理实体之间的视觉关系,与街道布局 (Ashihara, 1986)、景观设计(Cullen, 2012) 和土地使用功能 (Zube, 1987) 密切相关,并进而影响人类的感知 (Lynch, 1984)。正如地理学的第一定律所述:“万物皆相关,但近物相关性强于远物” (Tobler, 1970)。因此,空间结构涉及这些元素之间复杂的相互关系,并且它们的不同形式可能产生完全不同的结果或影响。例如,Celikors和Wells (2022) 发现两张视觉元素相似的图像,由于空间结构的变化,可能引发不同程度的心理恢复。虽然揭示空间结构对心理恢复的影响有可能丰富空间的解释性,但在早期的建模工作中,丰富而细致的空间结构差异一直难以衡量。
街景图像(Street View images,SVI)为从人的视角捕捉空间结构信息提供了宝贵的机会。这些图像具有较高的空间分辨率,并提供连续的数据(间隔50米),包含丰富的城市信息,已经被广泛用于城市形态 (Gong et al., 2019; Ito and Biljecki, 2021)、视觉感知 (Biljecki and Ito, 2021) 和健康行为 (Fan et al., 2023; Rzotkiewicz et al., 2018) 的研究中。同时,利用这些数据评估城市恢复质量也引起了越来越多的关注。一些研究探索了SVI预测城市恢复质量的潜力,证明了其效率和准确性 (Han et al., 2023; Ma et al., 2023)。此外,这些图像的连续性为探索街道单元内空间实体的内在联系提供了机会 (Zhang et al., 2023; Liang et al., 2023)。
近年来,方法上的突破,比如机器学习,被广泛应用于城市研究领域。其中,图神经网络(GNN)在捕捉外在关系和预测属性方面表现出显著优势,应用于交通流量、城市人口流动和社会感知等多个领域 (Liu and Biljecki, 2022; Zhang et al., 2023)。基于这些应用,我们的研究旨在利用这种方法,使用图形表示城市空间结构并评估其恢复质量。具体来说,我们提出了一种基于空间依赖的GNN方法,以揭示城市尺度上空间结构与恢复质量之间的关系。这种方法涉及两种不同类型的图:街道级别图和城市级别图。街道级别图通过道路单元内的连续街景图像捕捉实体之间的视觉关系,特别是空间结构;而城市级别图整合了包括社会经济、感知和空间特征的城市变量,同时考虑到周边环境,以衡量恢复质量。据我们所知,我们提出的评估城市恢复质量并揭示空间结构影响的方法具有开创性。
本研究在三个关键方面对研究领域做出了重要贡献:
我们提出了一种基于空间依赖的GNN方法,通过捕捉邻近空间特征,有效预测了城市级别图中的恢复质量。我们验证了空间结构对城市空间恢复质量的影响,并基于街道级别图探讨了不同恢复质量空间的内部空间结构。我们发现,在高恢复质量空间的空间结构中,自然相关实体(如树木)比人工实体(如建筑物)更为重要。【文献综述】
2.1. 城市环境中的恢复质量
注意力恢复理论(ART)为理解环境互动对心理健康的益处提供了框架。在ART中,心理恢复和认知功能改善是指在精神疲劳后的恢复 (Kaplan, 1995)。根据Kaplan和Kaplan (1989) 的观点,要恢复认知功能,环境应具备四个特质:远离、广度、吸引力和兼容性。“远离”使我们能够远离日常生活中的疲劳。“广度”指的是环境的广阔性以及它吸引我们探索的程度。“吸引力”是指环境能够吸引我们的兴趣而不会消耗我们的注意力资源的能力。“兼容性”则是指个体的需求或偏好与环境特征之间的契合度。
与自然环境互动的优势显而易见,比如减少焦虑 (Felsten, 2009),缓解压力(Capaldi et al., 2014),改善情绪 (Berman et al., 2008),以及提升在需要注意力和工作记忆的任务中的表现 (Bratman et al., 2015; Stenfors et al., 2019)。然而,以往的研究主要关注自然环境的对恢复的益处,且通常将其与城市环境进行比较 (Hartig et al., 1991; Ulrich et al., 1991)。而城市环境则通常被认为会消耗精神和注意力资源 (Kaplan and Berman, 2010; Schertz and Berman, 2019)。这种分类可能会加剧人们对“自然”与“城市”环境之间的对立印象。然而,城市元素如绿蓝空间 (Li et al., 2023) 和步行空间 (Han et al., 2023) 也与心理恢复相关联。一些城市地点也具有助于恢复的潜力,如艺术画廊 (Clow and Fredhoi, 2006)、购物中心和咖啡馆 (Staats et al., 2016)。然而,这些研究往往将城市环境视为一个同质化的类别,忽视了空间结构和地理相关性的变化(Velarde et al,2007)。
空间元素在不同的情境下可能具有不同的意义,空间模式的变化会导致空间结构的差异。历史研究和理论表明,人类心理感知与城市空间结构之间可能存在关联(Lynch, 1984; Ashihara, 1986; Zube, 1987)。然而,目前并没有确凿的证据表明心理恢复与空间结构之间存在直接的关联。Celikors 和Wells (2022) 提出,由于内在的空间表征,相似的视觉属性可能会引发不同的恢复判断,这表明这一领域需要进一步的研究。此外,城市居民的生活体验是由物理环境塑造且是连续的,应该将其考虑在内,因为城市是一个空间连续体和一个系统(Nordh et al., 2009; Lindal and Hartig, 2013)。先前的研究通常依赖于非连续、非地理标记的数据(Han et al., 2023; Ma et al., 2023),但根据地理学的第一定律(Tobler, 1970),在城市空间中,类似且相近的事物更具相关性。因此,在城市尺度上考虑空间结构和地理相关性是至关重要的。然而,传统方法往往受到时间和成本的限制,通常关注特定地点并使用小样本量(Nordh et al., 2009; Lindal and Hartig, 2013)。这就需要一个新的研究框架和数据来源。
2.2. 城市研究中的街景图像
近年来,众包数据在城市研究中得到了广泛应用,如街景图像(SVI)(Biljecki and Ito, 2021)。街景图像包含丰富的城市信息,被广泛用于提取环境特征 (Tang and Long, 2019; Wang et al., 2022; Zhou et al., 2019),构建城市知识图谱 (Zhang et al., 2023),分析环境健康 (Rzotkiewicz et al., 2018),以及预测人类的感知 (Zhang et al., 2018; Zhao et al., 2023)。Zhang等(2018) 首次提出通过语义分割计算城市特征的视觉感知,将SVI与六种人类感知(即美丽、无聊、生动、压抑、富裕和安全)建立联系。后续研究证实了这类数据在预测安全感知方面的准确性 (Kang et al., 2023)。此外,随着计算机视觉技术的发展,如图像分类 (Hu et al., 2020)、语义分割(Lauko et al., 2020) 和目标检测 (Zhao et al., 2023),分析大量SVI以研究城市问题变得更加高效。附录S1中的表S1展示了使用街景图像研究不同主题的论文数量。
此外,SVIs具有顺序属性和高空间分辨率,使研究人员能够在大尺度、小细节和时间上研究城市感知的变化。例如,Zhang等(2023) 通过SVI提取的语言信息捕捉场景实体之间的内在和外在关系,以预测城市土地功能。然而,很少有研究使用这些数据来评估城市恢复质量。在最近的一项研究中,Han等(2023) 首次通过1,250张SVI探索了大规模城市恢复质量评估框架,取得了准确的结果。Ma等 (2023) 也利用SVI探索了视觉特征与校园尺度上的恢复质量之间的关系。表1总结了使用街景图像评估恢复质量的10篇论文及其方法。然而,这些研究的一个重要限制是它们只处理非连续图像(单一图像),这意味着无法捕捉道路段场景实体之间的关系。因此,发掘SVI顺序属性的价值至关重要,这些属性可以代表空间结构,并进一步探索它们与恢复性感知之间的关系。
表1. 街景图像在修复质量研究中的应用方法统计
2.3. 空间依赖的图神经网络
图神经网络(GNN)在多个领域表现出优于传统模型的优势,如交通流量预测、城市人口流动和社会感知 (Liu and Biljecki, 2022)。它们能够处理结构化的非欧几里得数据,从图中提取空间特征进行高效学习 (Zhang et al., 2021; Yao et al., 2021),并捕捉城市特征的空间依赖性和异质性 (Liu et al., 2023; Liang et al., 2023)。根据地理学第一定律,特定范围内的城市区域可能由于城市场景与其邻近区域之间的强相关性而变得越来越相似 (Tobler, 1970)。先前的研究发现,已有研究发现,以图论为代表的邻域空间关系可以识别高级特征。Zhang等(2023) 构建了一个包含城市地理信息的城市知识图谱,并验证了GNN在表示城市空间结构方面的可行性和准确性。
GNN可以通过聚合算法学习相邻场景之间空间关系的深度表征,其中每个节点可以从其邻居中聚合特征 (Defferrard et al., 2016)。基于GNN的基本原理,已经开发出多种衍生模型,如图同构网络(GIN)(Xu et al., 2019)、图卷积网络(GCN)(Kipf and Welling, 2016)、图注意力网络(GAT)(Veličković et al., 2017) 和图采样与聚合(SAGE) (Hamilton et al., 2017)。凭借强大的数据组织能力和处理非欧几里得数据结构的能力,GNN可以将各种形式的城市数据整合到图神经网络中用于下游任务。这些数据包括SVI (Liu et al., 2023)、兴趣点(POI)(Xu et al., 2022)、土地使用 (Liang et al., 2023) 和社交媒体数据 (Liu and De Sabbata, 2021),并达到了最先进的性能。例如,Xu等 (2022) 将城市的视觉特征与POI数据相结合进行城市场景分类,与传统方法相比,提高了13%的精度。尽管GNN在处理各种城市任务方面具有强大的能力,但尚未有研究将其应用于城市恢复质量的研究。因此,我们的研究具有开创性。
【研究方法与数据】
在本研究中,我们提出了一种基于图形的框架,用于识别城市道路单元中具有最高或最低恢复潜力的位置,并探索在城市级别图中对心理恢复最重要的特征。研究框架包括五个部分(图1):1)提取特征并嵌入空间结构(即在街道层面构建);2)基于OpenStreetMap (OSM) ,将潜在的城市特征聚合成城市级图;3)对数据集进行标记和增强;4)训练和评估不同类型的分类模型;5)进行整体分析。本节将详细介绍第1至第4部分,第5部分将在结果部分进行分析。
我们的研究区域位于武汉三环内(见S1附录,图S1),武汉是湖北省的一个大城市,人口为1121万,是中国中部地区的代表性样本。在本研究中,我们收集了由OpenStreetMap (OSM) 提供的包括5075个道路单元的道路网络,并通过百度地图API从2022年7月至2023年6月以50米间隔采集了64750个全景街景图像样本。
图1. 研究框架。研究分为五个部分:1)提取与心理修复相关的城市特征,包括社会经济特征、感知特征和空间特征;2)将城市特征以道路单元为节点,以道路拓扑为边,构建城市级图;3)使用PRS -11问卷对每个道路单元进行评分和标记节点;4)以城市级图为输入,训练模型并进行预测,利用基于GNN的模型预测城市恢复质量;5)进行整体分析,包括评价模型性能、考察恢复质量的空间分布和空间结构。
3.1 提取特征并嵌入空间结构
我们的研究将城市特征分为三类,这些特征来源于各种城市数据源:1)感知特征(即使用SVI推断人类感知,包括物体数量、语义比例和感知得分);2)空间特征(即利用SVI构建街道级图并获取这些嵌入特征);3)社会经济特征(即根据POI和房价计算)。S1附录,表S2显显示所有变量的汇总统计信息。
感知特征。城市空间质量评估通常从SVI中提取物质空间特征,如围合度、绿化度、开放度和安全性(Tang and Long, 2019;Zhou et al., 2019)。先前的研究表明,图像的浅层视觉特征(即像素级别)和深层视觉特征(即语义和物体级别)会影响注意力恢复的感知(Ibarra et al., 2017;Celikors and Wells, 2022;Valtchanov and Ellard, 2015)。我们使用OpenCV计算街景图像的像素级信息(Zhao et al., 2023)。对于深层视觉特征的提取,包括语义分割以计算物理元素的比例和物体检测以计算实体数量,我们采用了MaskFomer (Cheng et al., 2021) 和DETR (Carion et al., 2020)。MaskFomer能够分割150种物体类别,而DETR可以检测90种物体类别,两者均具有最先进的性能。我们使用这些模型从SVI中提取视觉特征。
城市感知也会影响注意力恢复。更具美感的地方往往更具吸引力,这与Kaplan关于迷人空间能够恢复注意力资源的概念相一致(Berman et al., 2008)。对于感知得分的评估,我们使用了Place Pulse 2.0数据集,该数据集包含来自28个国家的56个城市的110,988张图像,具有六个标签:压抑、无聊、美丽、安全、活跃和富裕(Dubey et al., 2016)。通过对其初始版本的检验,未发现显著的文化或个人偏好偏见,表明其在全球研究中的可行性(Salesses et al., 2013)。我们使用Yao等 (2019) 提供的预训练模型来预测武汉市64,750个SVI的感知得分。表2总结了用于特征提取的模型和算法,所有感知特征的维度为D=251。
表2. 特征提取模型和算法总结
空间特征(街道级图)。实体之间的空间关系表现出内在和外在的关联,导致不同城市空间中相似元素之间具有很强的地理相关性(Kang et al., 2018;Zhang et al., 2023)。为了有效捕捉城市场景中的结构关系,我们利用包含在每个道路单元(即道路段)内的顺序街景视图。这种方法使我们能够捕捉和建立图像之间的关系,例如在相邻街景中识别相同的建筑物。
如图2所示,我们首先创建了一个城市场景实体的空间图。我们使用了一个名为Mask2Former的全景分割模型(Cheng et al., 2022)来捕捉语义和物体的城市特征,该模型在Cityscape数据集上训练,包含19个与城市相关的类别。与传统分割模型相比,Mask2Former不仅可以识别实例特征,还可以为每个物体标记不同的ID。这意味着我们可以通过判断相邻像素来轻松计算实体之间的关系。根据这些结果,我们为每个SVI构建了一个包含K个节点的无向图G=(V,E),其中V表示节点集,E表示边集。具体而言,对于每个节点类别i,我们将预测类别的节点的像素边缘识别为Ki。我们围绕两个像素展开这些像素边缘,并检查任意两个节点的像素边缘之间是否存在重叠。如果存在重叠或包含关系,我们认为这些节点是相邻的,并将边(Ki,Kj)添加到边集Ei,j中,表示节点Ki与节点Kj之间的相邻关系。最终,我们获得了每个SVI的城市实体空间图。
接下来,将来自同一条街道的顺序街景图像整合在一起,以代表最小单元(道路段)的空间结构。具体来说,我们使用ResNet-18模型(He et al., 2016)来计算同一空间单元内每个空间图中相同类别节点的相似度。每个节点将嵌入到一个1000维的张量中,然后计算同一类别节点之间的余弦相似度。如果两个图中节点的相似度高于0.80,这些节点将作为连接这两个图的桥梁。即使在相邻的顺序街景中检测到同一建筑物(即它有三个或更多的分段),它也总是连接到下一个代表同一建筑物实体的节点。此外,每个整合后的图使用GCN嵌入多维向量(D=32),代表每个道路单元的空间结构。GCN采用两层卷积方法,隐藏层大小为128个计算单元。代码已在GitHub上共享(https://github.com/MMHHRR/Restoration_Topology)。
图2. 嵌入空间结构。首先,通过推断实体像素之间的邻接关系,构建实体的空间图;
其次,通过计算两个图中对应实体(即同一类别)之间的余弦相似度来建立交叉图链接。实体嵌入采用ResNet-18。最后,以道路为最小单元,利用GCN将街道结构转化为向量。
社会经济特征。此外,我们使用POI数据来检查服务指标,并使用房价数据来检查每个道路单元的经济状况,这些特征已被证明与环境恢复质量相关(Subiza-Pérez et al., 2021;Samus et al., 2022;Luttik, 2000)。具体来说,POI数据包括23种功能类型,从金融服务到摩托车服务,详见S1附录,表S1。我们在2023年6月收集了这些数据,并使用空间连接工具计算每种类型的平均POI密度和每个道路单元的平均房价(以元/平方米为单位,即基于道路中心线以25米半径为缓冲区的平均值)。这些特征的维度为D=24。
3.2 特征聚合与图构建(城市级别图)
研究区域包括5075个OSM道路单元,每条道路的中点作为无向图中的一个节点(N = 5075),因为道路网络作为城市功能和交通的框架,塑造了城市的骨架(Hong and Yao, 2019)。我们将第3.1节中提到的城市特征聚合到这些道路单元中,并基于道路中心线创建了一个半径为25米的缓冲区,覆盖了大部分城市道路的宽度。使用空间连接工具将感知特征(D = 251)、空间特征(D = 32)和社会经济特征(D = 24)映射到相应的道路单元中。每个道路单元的向量维度为D = 310。
与此同时,我们利用道路网络的拓扑结构创建了一个空间权重矩阵,表示相邻道路之间的关系。具体来说,我们使用了一个n × n的矩阵(n为所有道路段的数量),用A表示道路之间的邻接关系。如果街道i和街道j之间存在邻接关系,则Ai,j的值为1;否则,Ai,j的值为0。我们采用K-Nearest方法(K=5)来确定道路连接关系,表示它们的邻接关系(即25,375个相邻关系)。这种方法防止了“悬空”道路的出现,但也可能将某些不相交的道路分类为附近的道路(Zhu et al., 2020)。
3.3 数据集标注与增强
在本节中,我们创建了一个基于图的数据集,专门用于预测城市恢复质量。恢复质量预测任务在城市级别图上被形式化为三类分类任务,其中每个节点代表一条道路。恢复质量类别被标注为高、中或低。此外,为了对每条道路(即节点)的恢复质量类别进行标注,我们在开发的平台上使用感知恢复性量表11(PRS-11)评估了大量的SVI样本。总共有1115条道路被标注,其中80%用于训练,剩余20%作为测试数据集(见表3)。有关采样过程的更多详细信息,请参见S1附录,图S2。
表3. 恢复质量数据集的统计分析。
为了评估采样的SVI的恢复质量,使用了感知恢复性量表11(PRS-11)进行了一项调查。最初的PRS-11由11个问题组成,其中两个问题与范围(scope)有关,三个问题分别与Pasini等人(2014)定义的远离(being away),连贯性(coherence)和吸引力(fascination)有关。根据Celikors和Wells(2022)的方法,我们在研究中选择了四个最佳问题描述每个指标。每个问题的具体说明和定义见表4。参与者被要求从我们开发的平台(图3)中选择最符合问题描述的图像。参与者可以选择点击“左”或“右”按钮,相应的图像将获得一分。如果参与者选择了“无”或“两者”,则相应图像将不会获得任何分数,或两幅图像都将获得一分。每幅图像的评估时间为30秒,每幅图像至少接受20次评估(Celikors and Wells, 2022)。
表4. 恢复质量评价问题描述(基于PRS-11问卷)。
图3. 城市恢复评价平台界面。
在为期一周的在线调查中,我们收集了120名参与者的评估结果,其中70名为女性(平均年龄=24.658岁),50名为男性(平均年龄=26.059岁)。该实验的伦理方面已通过大学机构审查委员会的审查和批准。为了计算四个指标的平均得分,代表SVI的综合恢复质量,我们采用了Trueskill方法(Herbrich et al., 2006)。得分按0到1的范围进行计算。随后,利用Jenks自然断裂法将最终结果分为前述的三类,并将这些分类标签分配给城市级别图的节点(表3)。
3.4 模型训练与评估
在本研究中,我们使用了图同构网络(Graph Isomorphism Network,GIN),该网络在各种基准数据集和图任务中表现出色(Xu et al., 2019)。GIN的显著特点在于它对GNN的表达性进行了精确的界定。GIN更新节点表示的关键方程如下(公式1):
其中,表示节点v在第k层的特征,是一个可学习的参数,用于为中心节点构建自循环。 是节点v的邻居节点集。表示第k层的多层感知器(Multi-Layer Perceptron),由可学习参数组成。GIN是众多强大GNN模型的其中之一,同时结构简单。关于模型结构,请参见S1附录,图S3。
此外,我们还进行了多项实验,将我们的方法与其他图模型进行了比较,包括拓扑自适应图卷积网络(Topology Adaptive Graph Convolutional Network, TAGCN)(Du et al., 2018)、基于注意力的图神经网络(Attention-based Graph Neural Network, AGCN)(Thekumparampil et al., 2018)、图采样与聚合(SAGE) (Hamilton et al., 2017)、图注意力网络(Graph Attention Network, GAT)(Veličković et al., 2017)、简化图卷积网络(Simplifying Graph Convolutional Networks, SGC)(Wu et al., 2019)以及图卷积网络(Graph Convolutional Networks, GCN)(Kipf and Welling, 2016)。在我们的研究中,GCN模型配置了两种不同类型的两层架构。GCN 1代表隐藏通道数设置为32和16,而GCN 2代表隐藏通道数设置为64和32。每个基于图的模型都训练了500个轮次。
此外,为验证基于GNN的模型所具备的空间依赖能力,我们还比较了五种不含任何空间权重的机器学习模型,包括随机森林(Random Forest, RF)(Breiman, 2001)、决策树(Decision Tree, DT)(Hastie et al., 2009)、K-最近邻算法(K-Nearest Neighbors, KNN)(Peterson, 2009)、径向基函数支持向量机(Radial Basis Function Support Vector Machines, RBF SVM)(Schwenker et al., 2001)以及梯度提升决策树(Gradient Boosting Decision Trees, GBDT)(Friedman, 2001)。更多参数和设置的详细信息见S1附录,表S3。我们使用准确率和F1分数(Hossin and Sulaiman, 2015)来评估模型的性能,并使用GNNExplainer(Ying et al., 2019)进行图模型的可解释性分析,从而使模型的预测过程更加易于理解(详细方法请参见S1附录,图S4)。
【结果】
4.1 空间依赖模型的性能和预测结果
根据图4所示结果,GIN模型在分类性能方面表现最佳(Acc = 0.749,F1 = 0.740),优于其他基于图的模型。其次是GCN2(Acc = 0.733,F1 = 0.711)和GCN1(Acc = 0.715,F1 = 0.705)的组内比较。另一方面,在表5所列的传统方法中,RF的分类性能最佳(Acc = 0.567,F1 = 0.440),其次是RGF SVM(Acc = 0.562,F1 = 0.407)和GBDT(Acc = 0.561,F1 = 0.405)。这些结果表明,考虑空间依赖性的基于图的模型在分类准确性上优于传统方法。这一结果支持了我们的假设,即在图网络中引入空间依赖性可以提高衡量恢复质量的准确性(Zhang et al., 2023; Liu et al., 2023; Liu and Biljecki, 2022)。更多详细信息见S1附录,表S4和图S5。
图4. 模型性能。本研究分析了8种基于图的模型的训练损失曲线(左)和准确率曲线(右)。这些模型使用的空间权值为K-Nearest,训练过程进行500个轮次。
表5. 模型预测性能
从混淆矩阵和T-SNE结果的分析中可以明显看出,GIN模型的分类性能令人满意(图5)。混淆矩阵展示了GIN模型在测试数据集中准确识别三类城市修复质量的能力。然而,在每一类中仍有部分道路被错误分类到其他类别。例如,在高质量道路的预测中,有10条道路被错误地分类为低质量。
我们将这种误分类归因于数据不平衡问题,因为中低质量数据实例更多。此外,我们还调查了模型是否有效地学习了视觉分类特征。通过降维GIN模型的输出层,我们发现模型充分具备了基于城市特征对恢复质量进行分类的能力。因此,后续研究将基于GIN模型展开。
图5. GIN模型预测结果分析(空间权值K-Nearest, epoch = 500)。(a)模型预测结果混淆矩阵。(b) T-SNE对GIN模型的输出层进行降维。
4.2 城市街道恢复感知的空间分布
如图6a所示,我们使用GIN模型对预测结果进行了可视化(高度饱和的线条表示高修复质量,否则相反)。在武汉三环内,共有1,344条高质量修复道路,1,420条中质量修复道路和2,311条低质量修复道路。高质量修复空间在整个城市中表现出聚集的模式,这可能与我们使用的预测模型有关。GIN模型不仅考虑了自身特征,还考虑了邻近节点的特征。
高质量修复空间主要集中在1、2、3、4和5号区域(图6a)。其中,区域1是武汉市最大的淡水湖——东湖,拥有迷人的滨水空间。滨水区在夏季表现出显著的恢复能力,能够带来凉爽感,并提供舒适的观光环境(Burmil et al., 1999)。有趣的是,其他高质量修复空间与周围公园或绿地密切相关,如2号区域的中山公园、3号区域的汉阳江滩公园和4号区域的后襄河公园。城市公园或绿地为注意力恢复提供了丰富的自然资源,与自然互动的益处显而易见(Dadvand et al., 2015; Engemann et al., 2019)。这也意味着城市绿色基础设施对邻近街道的空间结构产生了影响。令人惊讶的是,尽管位于高密度商业区,5号区域仍然被预测为具有高修复质量。我们认为这与周围的购物中心和历史街区有关,这些区域已被证明能促进注意力恢复(Staats et al., 2016; Fornara et al., 2009)。此外,我们发现低质量修复空间主要集中在住宅区,如6、7和8号区域。武汉是中国中部人口最多的城市,住宅用地占比最大。然而,单调的住宅空间容易令人感到乏味,高楼大厦减少了视野距离,影响了恢复质量(Lindal and Hartig, 2013; Zhang et al., 2018)。
根据预测结果,我们根据不同的恢复质量对街景进行了分类(图6b)。我们发现低质量空间缺乏绿色植被,建筑密度较高。在中等质量空间中,灌木的存在较多,在一定程度上提高了空间的修复质量。在高质量空间中,舒适道路的比例和丰富的自然城市景观增加了空间的魅力和吸引力。
图6. 武汉市城市空间恢复质量分布图。(a)恢复质量图。(b)恢复质量分类,地图来源:©OSM提供者。
此外,为了捕捉基于GNN模型的空间依赖性,我们使用GNNExplainer进行了可解释性分析(见第3.4节)。随机选择了一个道路单元,阐明该特定空间与周围环境之间的关系(图7)。分析结果显示,当街道125被预测为低质量修复空间时,邻近空间126(0.747)和3935(0.676)对其影响最大,其次是空间3964(0.654)。总的来说,基于GNN的模型不仅有效地考虑了邻近空间的影响,还提供了一个整体的视角。
图7. 基于空间依赖GIN模型的节点关系分析。(a)随机选择的道路网图。(b)节点对目标节点的贡献。(c)其周围实体之间的节点关系。
4.3 空间结构与修复质量的关系
如上所述,目前尚无研究确认空间结构在恢复性环境中的作用。我们基于GIN模型进行了消融实验,如表6所示。可以看到,在实验1中,综合考虑所有三类城市特征时,获得了最佳的分类性能(Acc = 0.749,F1 = 0.740)。然而,在实验2中,当我们仅移除空间特征时,分类性能显著下降(Acc = 0.668,F1 = 0.667)。为了进一步确认空间特征对预测结果的影响,我们分别进行了实验3和实验4,去除感知和社会经济特征。最终结果证实,空间特征显著影响了模型的分类性能(实验3:Acc = 0.708,F1 = 0.705;实验4:Acc = 0.722,F1 = 0.718)。仅考虑空间特征的实验5同样表现出良好的分类性能(Acc = 0.704,F1 = 0.703)。总的来说,空间特征提高了预测准确性,并显著影响了模型性能,表明空间结构对空间恢复能力具有重要影响。更多详细信息见S1附录和表S5。
表6. 基于GIN模型的消融实验结果
为了进一步探讨空间结构对城市修复质量的影响,我们使用GNNExplainer作为工具,解开模型预测的“黑箱”。基于实验5,我们直接使用空间图(不嵌入)作为输入,使用GIN模式(即图分类)来预测恢复质量。因此,我们能够识别出哪些实体显著影响空间恢复质量,并确定它们在街道级别图中的重要性。图8展示了武汉市两个选定研究区域的结果,分别代表低修复质量和高修复质量的空间。结果显示,人造实体,如人行道(0.543)、围栏(0.531)和建筑物(0.526),对低质量空间的贡献更大。相反,天空(0.503)和植被(0.491)等实体对高质量空间的影响更大,这与之前的研究一致(Ma et al., 2023)。
图8. 不同恢复性空间的节点贡献与空间结构。(a)低质量恢复空间(b)高质量恢复空间。
此外,我们利用中介中心性指标来衡量每个街道级别图中实体的重要性。中介中心性值较高的节点(或实体)被认为在网络中对视觉感知具有更大的影响或控制力(Brandes, 2001)。图9展示了计算得出的前100个道路单元及其对应类别的结果。这些结果一致显示,具有高修复质量的空间通常表现出更高的自然实体中介中心性值,如植被(0.144)、地形(0.129)和天空(0.121)。这些发现进一步支持了这些自然元素在提升城市空间修复质量中发挥重要作用的观点。
图9. 19种空间实体在三种恢复性空间质量中的中间性中心性。“1”代表低恢复质量,“2”代表中等恢复质量,“3”代表高恢复质量。
【讨论】
本研究引入了一种空间依赖的GNN方法,用于预测城市恢复质量并揭示空间结构与恢复空间之间的关系。通过嵌入多个顺序SVI(空间视觉信息)的空间单元图,探讨了空间结构对恢复质量的影响以及恢复空间的结构异质性。研究结果表明,空间依赖的GNN通过从多种特征和地理关系的融合中学习,不仅考虑了特定位置的环境,还提供了整体视角。这种方法有助于全面理解城市尺度下的恢复特征,最大程度地考虑了空间之间的相互依赖性。因此,本研究填补了关于空间结构如何影响恢复质量的认知空白。
此外,我们发现空间结构在很大程度上决定了城市环境的恢复质量。在低恢复质量的空间中,非自然实体的重要性显著高于自然实体,而在高修复质量的空间中,情况则相反,自然实体变得更为重要。这与之前的研究一致,显示了自然元素与恢复之间的正相关关系,以及它们带来的各种健康益处(Capaldi et al., 2014; Schertz and Berman, 2019)。
除了空间结构的影响外,我们的研究还揭示了城市中高质量恢复空间的分布特征。特别是城市滨水空间显得尤为显著。水景被认为是积极的恢复性视觉元素,人们倾向于在水景丰富的区域散步或骑行以减轻压力(Massoni et al., 2018)。此外,自然水体的特征可以无缝融入周围的自然景观,增强美学体验并恢复注意力资源(Markevych et al., 2017; Roe et al., 2019)。因此,在城市设计和重建中,滨水景观类型应优先考虑。此外,城市绿地与高修复质量密切相关,许多研究表明城市绿地(如城市公园)对心理健康有益(Nordh et al., 2011, 2009)。因此,本研究为城市修复潜力提供了进一步的证据。
此外,虽然SVI在城市研究中正逐渐成为重要的数据来源(Tang and Long, 2019; Biljecki and Ito, 2021),但利用其在城市尺度上研究空间恢复质量的研究仍然有限。SVI在研究中表现出显著优势。首先,它具有广泛的覆盖范围、快速的更新速度和精确的地理坐标。其次,它包含丰富的视觉和空间信息,并且在用于预测人类感知时,数据偏差较小(Kang et al., 2023; Zhao et al., 2023; Ma et al., 2023)。在本研究中,为了预测城市恢复质量,使用了大量SVI来提取视觉特征和人类感知,并将空间结构嵌入到顺序场景中。结果证明,SVI可以准确预测城市恢复质量,并展示了其在表示空间结构方面的优势。
同时,本研究也存在一些局限性。首先,城市环境是动态的,受人类活动、城市功能和交通状况等因素的影响(Kaplan and Herbert, 1987; Quercia et al., 2014)。例如,声音和温度等复杂特征可能会影响恢复质量(Hartig et al., 2007; Qi et al., 2022; Ratcliffe, 2021)。未来可以通过整合多模态数据或包含这些要素的数字环境,扩展到更广泛的维度,以探索这些可能影响环境恢复质量的因素。其次,SVI数据捕捉的城市特征只反映了城市场景的特定时刻,因而存在时间滞后性。此外,SVI主要是从驾驶视角捕捉的,缺乏从行人视角感知内容的能力(Biljecki and Ito, 2021)。最后,在恢复环境中,结构简单的PRS-11可能会削弱对环境恢复质量的评估准确性。未来的研究可以考虑引入更多元的注意力恢复问卷和问题,以提高结果的精确性。
【结论】
在有关恢复质量与物理环境之间关系的长期讨论中,缺乏关于多样化空间结构影响的研究,同时在城市尺度上进行有效测量的方法也较为匮乏。我们的研究提出了一种空间依赖的GNN方法来解决这些问题,包括两种类型的图:街道级和城市级。本研究做出了三个贡献。
首先,我们提出了一种空间依赖的预测方法,通过图神经网络捕捉道路拓扑关系,并聚合城市的空间环境特征为城市级图,用于衡量城市恢复质量。其次,我们采用了一种新颖的图方法,通过捕捉实体之间的内在和外在关系,揭示了不同恢复质量之间的空间结构效应。这些关系通过顺序的SVI得以展现。第三,研究强调了与高修复质量相关的自然实体(例如树木)相比于人工实体(例如建筑物)的重要性,从而增强了对恢复性空间特征的理解。
总体而言,本研究为健康城市的建设提供了洞见,提升了对城市恢复空间的可解释性,并且可以进一步应用于中尺度健康空间(如社区或公园)的设计。
来源:城市数据研习社