摘要:现有光伏数据集普遍存在空间分辨率不足、无法有效识别光伏面板间间隙、难以探测小型分布式电站等问题,导致面积被高估、细节缺失,难以支撑精细化的能源规划与生态评估。
在“双碳”战略目标的驱动下,中国已成为全球最大的光伏市场,其装机容量持续快速增长。
然而,光伏产业的迅猛发展对高精度、空间显式的监测数据提出了迫切需求。
现有光伏数据集普遍存在空间分辨率不足、无法有效识别光伏面板间间隙、难以探测小型分布式电站等问题,导致面积被高估、细节缺失,难以支撑精细化的能源规划与生态评估。
为解决上述挑战,有相关研究团队开发了一种创新的地形增强的深度学习语义分割框架,并成功生成了2024年中国光伏电站矢量数据集。
该数据集首次实现了在全国34个省级行政区域范围内,对光伏电站进行面板级的精准识别与矢量边界刻画,在精度与细节上均取得了显著突破,为理解中国光伏发展的空间格局提供了前所未有的数据支撑,请在文末查看领取方式。
数据介绍
CPVPD-2024数据集的生产融合了多源地理空间数据与前沿的深度学习技术,其核心流程与创新点在于。
多源高分辨率影像,采用“天地图”0.5-2米和“World Imagery Wayback” 0.6-1.2米卫星影像作为底图,确保了亚米级特征提取能力。
地形与土地覆盖融合的采样策略,创新性地整合了中国土地覆盖数据集CLCD和GEBCO高程数据,构建了覆盖15种“地形-土地覆盖”组合类型的训练样本集,极大增强了模型在复杂地理环境下的泛化能力。
收集了不同地形的光伏数据
先进的深度学习模型,采用动态空间-频率注意力SwinNet语义分割架构。
该模型能联合优化空间纹理和频域边缘特征,特别擅长识别多尺度光伏面板及其规则间隙,有效避免了传统方法对非发电区域的错误分类。
严格的形态学与人工后处理,通过Canny边缘检测、几何约束过滤以及基于QGIS的人工拓扑校正,确保了最终矢量边界的几何精度与合理性。
光伏数据集分布图
基准年份2024年,空间范围,中国涵盖所有34个省级行政区域,包括台湾省。
数据格式为SHP矢量格式,空间参考为EPSG:4326(WGS84地理坐标系)。
数据总量约为1.36 GB大小,压缩包有332 MB大小。
数据集按省级行政区提供34个独立的Shapefile文件。每个矢量面要素代表一个连续的光伏电站或其中的一个独立阵列。
其属性表包含以下关键字段如下:
Uid:每个光伏电站的唯一标识符。
Area:光伏电站的面积(平方米),基于等积投影计算,可用于精确的装机规模统计。
latitude/longitude:光伏电站的质心坐标。
landcover:该地块在CLCD数据中的主导土地覆盖类型(如耕地、草地、裸地等)。
dem:该地块的平均高程值。
数据在GIS软件中如何加载
在将CPVPD-2024数据加载到ArcGIS Pro中进行可视化与分析。
打开ArcGIS Pro工程,直接将SHP格式文件拖拽至地图窗口,或通过“目录”窗格定位到文件并右键选择“添加到当前地图”。
在内容列表中,右键单击加载的CPVPD-2024图层,选择“符号系统”。
青海省某光伏电站
在“符号系统”窗格中,确保“主符号系统”为“单一符号”。您可以点击符号,更改填充颜色,如建议使用深蓝色或橙色和轮廓线,以便清晰显示。
缩放至已知的大型光伏基地,如青海、宁夏等地,可以清晰地看到数据集中光伏电站的矢量轮廓,甚至能分辨出面板间的规则间隙,验证其高精度特性。
江西省内某光伏电站
使用“识别”工具点击任意一个光伏面要素,即可在弹出的窗口中查看其面积、所在土地类型等详细属性。
云南省内某光伏电站
打开图层的属性表,可以使用“选择”工具或“按属性选择”功能,筛选特定区域或特定土地类型(如 "landcover" = 'Cropland')的光伏电站。
台湾省内某光伏电站
利用“统计”功能,对 Area 字段进行统计,可快速计算某个区域的光伏总装机面积。
空间分布模式分析,将CPVPD-2024数据与行政区划图、土地利用图或地形图进行叠加,可以直观分析中国光伏电站“东部分布式、西部集中式”以及“以农业光伏为主、集中分布于干旱半干旱区”的宏观空间格局。
如果你没有安装ArcGIS,也可以将矢量数据加载到水经微图5(简称“微图5”)中查看。
微图5是一个基于WeMapEngine为内核研发的全新版本,可以实现秒加千万级SHP数据的功能。
在微图5中,你可以将数与吉林一号、星图地球、天地图、自定义等卫星影像加载叠加查看,如下图所示。
微图5中加载效果(一)
微图5中加载效果(二)
微图5中加载效果(三)
微图5中加载效果(四)
该数据集的发布具有重要的科学价值与广泛的应用前景,为国家和地方政府提供精确到具体地块的光伏装机容量空间清单,助力能源基础设施的优化布局。
精确的面积数据使得评估光伏建设对耕地、草地等生态系统的实际占用成为可能,服务于更科学的生态保护决策。
作为清洁能源项目的空间显式清单,是核算区域碳减排量和研究能源转型环境效益的关键基础数据。
为光伏产业链相关企业提供市场布局、投资选址的宏观与微观空间洞察。
写在最后
CPVPD-2024是中国首套全国性的、面板级光伏电站高精度矢量数据集。
它通过引入地形增强的深度学习框架,成功解决了现有产品在细节识别和环境适应性方面的关键难题。
参考资料:
Yang, Y., Lin, S., Lu, R. et al. CPVPD-2024: A Chinese photovoltaic plant dataset derived via a topography-enhanced deep learning framework. Sci Data 12, 1601 (2025).
来源:水经注软件