摘要:有效监测可持续发展目标(SDGs)对推进全球可持续发展至关重要。然而,普遍存在的数据缺口持续阻碍着对各国及各项目标的准确评估。为应对这一挑战,本研究基于世界银行数据库中2000-2020年期间的380项可持续发展目标指标,开发出融合降维与机器学习插补技术的数据
文章基本信息
期刊:Sustainable Production and Consumption(中科院一区TOP)
英文题目:A data-driven framework for assessing global progress towards sustainable development goals
中文题目:评估全球实现可持续发展目标进展情况的数据驱动框架
发表时间:2025年
文章链接:
摘要
有效监测可持续发展目标(SDGs)对推进全球可持续发展至关重要。然而,普遍存在的数据缺口持续阻碍着对各国及各项目标的准确评估。为应对这一挑战,本研究基于世界银行数据库中2000-2020年期间的380项可持续发展目标指标,开发出融合降维与机器学习插补技术的数据驱动综合评估框架。通过主成分分析(PCA)与多元回归的组合方法筛选核心指标,并采用基于随机森林(RF)的missForest算法填补缺失数据。基于完善后的数据集,评估了2000至2020年间全球215个国家和地区可持续发展目标综合指数及17项具体目标的实施成效。研究结果表明:(1)识别出218项主要指标,覆盖初始数据集90%以上的信息;(2)通过稳健的缺失值填补方法,实现约0.2的归一化均方根误差(NRMSE)和约0.08的错误分类比例(PFC); (3) 全球可持续发展目标绩效呈现稳步提升态势,但存在显著区域差异——欧洲领先,非洲落后,亚洲进步最快;(4) 不同目标间发展不均衡,部分目标面临重大挑战。本研究提升了全球可持续发展目标绩效评估的完整性与适用性,为制定更具针对性的可持续发展政策提供了实证依据。
问题提出
本研究旨在系统性地探讨三个核心问题:(1) 现行可持续发展目标指标框架如何有效应对高比例数据缺失与结构性缺失的挑战,以提升评估的代表性和完整性?(2) 如何构建全球一致且高度可比的绩效评估框架,以支持跨国与纵向可持续发展目标比较?(3) 重构的高质量数据集在全球层面及各可持续发展目标中揭示了哪些时空模式?为此,我们构建了一个融合降维技术与机器学习插值方法的数据驱动综合评估框架,并将其应用于涵盖2000-2020年期间215个国家和地区、共计380项可持续发展目标指标的实证分析。首先,采用主成分分析(PCA)结合多元回归方法,筛选出一组核心指标,从而减少指标总量。其次,运用基于迭代随机森林(RF)的缺失值填补算法missForest,精准补全缺失数据并提升数据集完整性。最后,基于重建的完整数据集,我们评估了全球可持续发展目标综合指数及其17个具体目标的时空演变。本研究不仅为可持续发展目标的综合评估提供了可迁移的技术路径,更为国际社会监测全球可持续发展进程提供了可复制且高度可比的分析工具与实证参考。
未来展望
尽管取得显著进展,本研究仍存在局限性。首先,尽管采用了先进的插补技术,但对于存在严重数据缺失或质量低劣的指标,插补准确性仍受制约。其次,研究基于2000至2020年的历史数据,而持续的社会经济变化与政策调整要求不断更新和完善评估模型。此外,社会文化与政治因素对可持续发展目标实现的复杂影响尚未得到充分探讨。未来研究应着力拓展数据来源多样性、优化模型精度、整合跨学科方法,构建更具动态性与精确性的全球可持续发展评估框架,从而为基于证据的决策制定与实践落地提供更强有力的支持。
文章主要图表
来源:新浪财经
