摘要:极端天气事件会引发气象、水文和地球物理灾害,对人类社会与经济构成严重威胁。在全球气候变化的背景下,这类事件的频率、强度和危害在持续上升。预计到2030年,全球将有约4万亿美元的资产和数亿人面临极端天气事件造成的威胁。因此,研究极端天气事件对于风险评估、预测预警
导语
极端天气事件会引发气象、水文和地球物理灾害,对人类社会与经济构成严重威胁。在全球气候变化的背景下,这类事件的频率、强度和危害在持续上升。预计到2030年,全球将有约4万亿美元的资产和数亿人面临极端天气事件造成的威胁。因此,研究极端天气事件对于风险评估、预测预警和灾害管理至关重要。本文首先介绍了极端天气事件的基本概念,随后回顾了目前该领域的主要研究内容,最后介绍了相关研究方法与模型,并讨论了不同方法的优势与局限。
极端天气事件是指在特定时空尺度上发生的、相对于历史气候状态具有显著异常性、概率极低但破坏性极强的天气现象,包括极端高温、寒潮、暴雨、干旱、台风、暴雪、极端风暴、冰雹和热浪等。通常,这些事件位于气候变量概率分布的尾部,在统计意义上可定义为超出特定分位数的极端值[1]。
极端天气事件的成因复杂多样,是多尺度气候过程、局地地形条件、下垫面特征及人为因素共同作用的结果。从大尺度来看,极端事件常与大气环流异常、海气相互作用、季风变化、遥相关现象密切相关。例如,厄尔尼诺事件期间,全球多地的极端降水、干旱和热浪事件的发生概率显著增高[1]。此外,陆面过程、局地地形等也会调节极端天气的发生与发展[2-3]。
图1. 极端事件的发展取决于有利的初始状态、大规模驱动因素的存在、正反馈以及随机过程(噪声)。这些因素的相对重要性因不同类型的极端情况而异。例如,对流风暴等短期事件(蓝色)的反馈通常与不稳定的大气动力学有关,而热浪或干旱等持续时间较长的事件(红色)通常涉及土壤水分-大气相互作用。全球变暖等外部因素可以通过这些不同的因素影响极端事件。例如,在较暖的大气中增加的水蒸气会增强对流反馈,或者增加的表面蒸发可能会放大热浪和干旱。(Sillmann et al., 2017)
极端天气事件不仅是自然气候系统的自然变率体现,也越来越多地受到全球气候变化和人类活动的影响,其频率、强度和空间分布正在发生显著变化。近年来,极端天气事件呈现出“增多、增强、加剧”的趋势。根据联合国政府间气候变化专门委员会(IPCC)发布的多次评估报告,自20世纪中后期以来,全球范围内极端高温事件的频率显著上升,而极端低温事件的发生频率则在下降。同时,极端降水事件在多个地区呈现增强趋势,干旱和热浪等事件的持续时间和影响范围也在扩大。这不仅对自然生态系统造成破坏,更对农业生产、水资源管理、公共卫生、能源安全和基础设施带来了严重威胁。此外,极端天气事件的“复合性”特征也日益凸显,这进一步增加了灾害风险和应对难度[3]。因此,深入理解极端天气事件的发生机制、演变规律及其与气候变化的关系,是当前地球系统科学研究的重要任务,也对灾害风险管理、基础设施规划和政策制定具有重要意义。
图2. 2011-2013年美国气象学会公报中考虑的极端天气事件。(Stott et al., 2016)
目前,关于极端天气事件的研究内容,主要集中在极端天气事件的检测、极端天气事件的归因分析、极端天气事件的模拟与预测,以及极端天气事件的影响评估与风险分析上。
极端天气事件的检测与监测是气候科学与防灾减灾领域的重要基础,旨在通过科学方法识别、量化并追踪发生在不同时空尺度上的极端事件。准确的检测不仅有助于理解极端事件的气候背景和变化趋势,也是进行风险评估、归因分析和预测预警的前提。
从数据来源看,极端天气事件的检测主要依赖多种观测资料,包括地面气象站点观测、遥感卫星资料、再分析数据集以及各类专业监测网络。地面观测数据因其时间序列长、精度高,在极端温度、降水、风速等指标的检测中具有不可替代的作用。然而,在高山、极地、沙漠等数据稀缺地区,以及暴雨、风暴、冰雪覆盖等空间尺度较大的极端事件中,卫星遥感和再分析产品提供了重要补充[4]。
在检测方法上,目前主要采用统计方法和阈值法进行极端事件识别。统计方法以概率分布为基础,通常通过计算气候变量的分位数(如90%、95%、99%)来定义极端阈值[1]。例如,极端降水可定义为单日或多日累计降水超过历史特定百分位的事件。这种基于统计分布的定义有助于在不同区域和气候背景下进行相对比较,但也面临观测数据完整性和时间序列长度的限制。绝对阈值法则以固定数值作为极端事件的界定标准。这种方法在气象预报和灾害应急中应用较多,便于公众理解和操作,但在不同气候区可能存在适用性偏差。此外,随着数据科学与AI技术的发展,基于聚类分析、模式识别、深度学习等方法的智能化检测技术逐渐涌现,在复杂多变量极端事件检测中展现出潜力。
极端天气事件归因是极端天气研究的一个重要分支,旨在确定人类活动(如温室气体排放)或自然因素(如火山活动、太阳辐射变化)对特定极端天气或气候事件的发生概率或强度的影响。当前,极端事件的归因研究主要分为两大类:一是针对长期气候变化趋势的归因分析,评估过去几十年中极端事件频率、强度变化的驱动因素;二是针对单个事件的“事件归因”,分析特定事件中人类活动的影响程度[5]。尤其是在极端事件造成严重灾害时,事件归因可以快速回应社会对“是否因气候变化所致”的疑问,因此近年来发展迅速。
目前,归因分析的方法体系大致可分为三类。第一类是基于统计模型的方法,通过历史观测数据分析极端事件的发生概率与长期气候因子的统计关系,从中推断人类活动对概率分布的改变。这类方法操作简便,数据驱动性强,但对数据完整性、序列长度要求高,且难以直接解释物理机制。第二类是基于气候模型模拟的方法,通过控制模拟实验,分别运行包含与不包含人为强迫(如温室气体、气溶胶排放)的气候模型,统计分析两组模拟结果中事件发生的概率差异。这种方法强调物理过程的可解释性,是当前归因研究的主流路径。第三类是结合统计与动力学的“多方法集成”方法,通过多模型、多数据、多方法交叉验证,提高归因结果的稳健性和不确定性量化水平[6]。
极端天气事件的归因分析也面临一系列挑战。一方面,不同气候模式对极端事件的模拟能力存在局限,尤其是在区域尺度、短时间尺度和复杂气候背景下,模式的不确定性较大。另一方面,事件定义、分析区域、时间窗口的选择,也会对归因结果造成影响[5]。
极端天气事件的模拟与预测旨在通过数值模型和数据驱动方法对极端事件的发生概率、空间分布、强度演变等进行科学预估。这不仅是理解极端事件物理机制的重要手段,更为防灾减灾、应急响应、政策制定提供了科学依据。目前,极端天气事件的模拟主要依托于气候模式(Climate Models)和数值天气预报模型(Numerical Weather Prediction Models)。
在气候尺度上,全球气候模式和区域气候模式通过模拟不同温室气体排放情景下的大气环流、海气相互作用、能量平衡等过程,预测未来几十年极端高温、极端降水、干旱、热带气旋等事件的变化趋势。研究表明,在高排放情景下,未来极端高温事件的频率和强度将大幅增加,极端降水事件在多数地区也呈现增强趋势。
数值天气预报模型则侧重于短期(小时至周尺度)极端天气事件的预报。随着模式分辨率和物理过程参数化方案的改进,现代数值预报已能较为准确模拟台风路径、暴雨分布、强对流天气等极端事件的发生与发展。然而,对于极端事件的精确预报仍面临不确定性,尤其是在复杂地形、局地对流和多尺度相互作用等情境下,预测能力仍有限[1,5]。
除传统动力学模型外,机器学习(Machine Learning, ML)与深度学习(Deep Learning, DL)等人工智能技术近年来在极端天气事件模拟与预测中得到快速应用。机器学习通过对历史观测数据、再分析数据和模式输出的训练,可以建立非线性、多变量的预测关系,用于短时临近预报或对传统数值模式的输出进行后处理修正。深度学习进一步借助复杂神经网络结构(如卷积神经网络、循环神经网络),能够从大规模、多源异构数据中自动提取特征,展现出在模式精细化、因果关系挖掘、模式降尺度等方面的潜力。例如,基于神经网络的模型已被用于热带气旋路径预测、极端降水空间分布重建等任务[7]。
图3. 使用AI进行极端天气事件研究的案例(干旱、热浪、野火和洪水)。(Camps-Valls et al., 2025)
此外,统计-动力学降尺度(Statistical-Dynamical Downscaling)方法也在极端事件模拟中发挥重要作用。该方法结合统计关系和物理模拟结果,将气候模式的粗分辨率输出细化为区域或局地的气候信息,适用于评估小尺度极端事件在未来气候中的变化风险。
除了传统的确定性预报,概率预测(Probabilistic Forecasting)和集合预报(Ensemble Forecasting)也逐渐受到重视。这些方法通过多次运行不同初值或参数设置的模式,输出概率分布或不确定性范围,为决策提供更全面的风险信息。尤其在极端事件的早期识别和应急响应中,概率性信息有助于平衡防灾投入与实际风险。
极端天气事件的影响评估与风险分析旨在量化极端事件对社会、经济、生态系统和基础设施带来的潜在损害,为灾害风险管理、政策制定和适应性措施提供科学依据。随着极端事件的频率、强度和空间分布的不断变化,系统化、综合化的风险评估需求也日益增加。
风险分析通常采用“风险=危险性×暴露性×脆弱性”框架。危险性指极端事件的发生概率和强度,暴露性反映受影响的人口、资产和基础设施的空间分布,脆弱性则衡量暴露对象在极端事件中的抗冲击能力。通过将气候模拟数据、社会经济统计、土地利用信息、基础设施分布等多源数据进行整合,可以实现对区域极端天气风险的定量化、空间化表达[1,8-9]。
在方法上,风险分析逐渐从静态风险评估向动态风险管理转变。除传统的统计分析、地理空间分析之外,基于情景模拟、蒙特卡罗分析、人工智能算法的多情景、多不确定性风险模拟技术得到广泛应用,能够更好捕捉风险的动态性和不确定性。
统计学模型被广泛应用于极端事件的检测、归因、模拟与风险评估中。通过基于观测数据的统计方法,可以揭示极端事件的概率特征、变化趋势以及与气候因子的关系,为后续的物理建模与政策应用提供重要依据。
极值理论(Extreme Value Theory, EVT)是研究极端天气事件最经典的统计方法之一。其核心模型包括广义极值分布(Generalized Extreme Value Distribution, GEV)和广义帕累托分布(Generalized Pareto Distribution, GPD),可分别用于块极值(block maxima)和超阈值(peak over threshold, POT)分析[4,10]。EVT通过对气候变量的极端值进行概率建模,估计极端事件的重现期、极端值分布和超阈值概率。通过EVT,研究者可以计算“50年一遇”“100年一遇”等极端事件的发生概率,为基础设施设计、防灾减灾提供参考。
回归模型被广泛用于评估长时间序列中极端事件与气候驱动因子之间的关系。例如,采用多元线性回归、广义加性模型(Generalized Additive Model, GAM)等方法,可以探究极端降水事件与海表温度、ENSO指数、北大西洋涛动(NAO)等大尺度气候因子的统计关联。这类模型强调解释性,适合从历史观测数据中提取经验关系,为因果机制分析提供初步线索。
贝叶斯框架通过引入先验知识与观测数据的结合,提供了一个概率化、不确定性可量化的分析工具,近年来在极端事件研究中也被越来越多使用。特别是在数据有限、样本稀缺的极端事件中,贝叶斯方法可通过先验分布借力外部信息,提升估计的稳健性。目前,贝叶斯方法已被应用于极端事件的变化点检测、事件归因、风险预测等领域,例如通过贝叶斯层次模型检测极端事件时间序列中的突变点,分析极端事件频率的阶段性变化[1,11]。
动力学模型通过对大气、海洋和陆面系统的物理过程进行数学描述和数值计算,实现对极端事件发生、发展和演变的模拟与预测。相比统计模型主要依赖观测数据的经验关系,动力学模型强调从基本物理定律出发,因此具有较强的可解释性和可预测性。
动力学模型的基础是描述大气运动的控制方程组,包括质量守恒方程、动量守恒方程、能量守恒方程和状态方程等。这些非线性偏微分方程通过数值方法离散化,结合初始场和边界条件求解,形成全球或区域的大气环流模拟。在极端天气研究中,常用的动力学模型主要包括全球气候模式、区域气候模式和数值天气预报模式。
在气候尺度上,全球气候模式通过模拟全球尺度的海气耦合过程、辐射平衡、能量输送等,能够预测未来几十年至百年尺度下极端高温、极端降水、台风频率和强度等的变化趋势[1,4]。同时,随着模式分辨率的提升,GCMs在极端事件模拟中的表现得到改善,尤其在大尺度事件(如热带气旋、极端高温)模拟上更为可靠。
区域气候模式则专注于对特定区域的高分辨率模拟,能够更好捕捉复杂地形、局地环流和小尺度对流对极端事件的影响。通过动态降尺度技术,区域气候模式将全球气候模式提供的大尺度背景信息嵌套到更高分辨率的区域模式中,实现对极端天气事件的细致模拟。
在短期预测方面,数值天气预报模式通过实时同化观测资料,能够对未来几小时至数天的极端事件进行高时效性预测。随着超级计算能力增强和模式物理过程不断完善,数值天气预报已能较为准确模拟台风路径、强降水分布、强对流天气等。然而,在一些局地突发性极端事件中,预测的不确定性依然存在。
近年来,动力学模型也开始与数据驱动方法(如机器学习)结合,通过模式输出的统计修正、误差订正、过程优化等方式提升极端事件模拟能力[2,7]。例如,利用深度学习算法对模式输出进行偏差校正,或通过数据同化技术增强模式对初始条件的不确定性约束。
随着数据量的急剧增加和计算能力的显著提升,机器学习(Machine Learning, ML)和深度学习(Deep Learning, DL)在极端天气事件研究中展现出强大的潜力,逐渐成为继统计模型、动力学模型之后的新兴技术路径。通过对历史观测数据、再分析数据、气候模式输出等多源数据的训练,机器学习与深度学习能够发现复杂、非线性关系,实现极端事件的检测、模拟、预测和归因。
在极端事件检测方面,机器学习已被广泛应用于模式识别、异常值检测等任务。例如,利用支持向量机(SVM)、随机森林(RF)、K近邻(KNN)等算法,通过输入多变量气象因子,识别出极端降水、强对流、热浪等事件的时空分布。相比传统统计方法,机器学习不依赖于特定分布假设,能够在复杂的高维数据中自动提取有效特征,提高检测的灵活性和准确性。
在极端事件预测中,深度学习因其强大的特征表达能力和时空建模能力,受到越来越多关注。卷积神经网络(CNN)已被应用于极端降水、强风、热带气旋等空间模式的预测,通过多层卷积操作提取空间特征,实现精细化空间分布预测。循环神经网络(RNN)、及其变体(如LSTM、GRU)则擅长处理时间序列数据,能够模拟极端事件的时间演变规律。近年来,结合CNN和RNN的混合神经网络、图神经网络(GNN)等新兴架构也逐渐应用于极端天气的预测任务,展现出更优的性能。
图4. 深度学习模型用于极端天气事件预测的典型案例:(a) CNN, (b) RNN。(Salcedo-Sanz et al., 2024)
除了监督学习,无监督学习和生成模型也在极端天气事件研究中发挥作用。通过聚类分析、自编码器、生成对抗网络(GAN)等方法,研究者能够发现极端事件的潜在模式、进行数据增强、合成虚拟极端事件样本,用于风险情景构建与模型训练。例如,GAN被用来生成罕见的极端降水事件样本,弥补观测记录中极端事件样本不足的问题,从而提升预测模型对“尾部事件”的识别能力。
在风险评估中,机器学习与深度学习也被用作多源数据融合与非线性风险建模工具。通过将气候因子、社会经济数据、土地利用信息等多维数据输入模型,机器学习能够构建综合风险模型,量化不同地区、不同系统的极端天气风险水平。这类数据驱动的风险模型具有高度灵活性,能够快速适应不同区域、不同情景的风险分析需求。
尽管机器学习与深度学习在极端事件研究中展现出巨大潜力,但也存在一些挑战。首先,模型的“黑箱性”问题导致结果的可解释性有限,难以揭示极端事件背后的物理机制。其次,极端事件本身是“尾部事件”,样本数量稀少,导致模型在极端情况的泛化能力不足。第三,模型的性能高度依赖于数据质量与特征选择,在数据偏差、观测缺失等情况下,可能导致预测偏误。
为应对这些挑战,研究者提出了 “物理引导的机器学习”(Physics-informed Machine Learning)、“混合建模”(Hybrid Modeling)等方法。物理引导的机器学习通过将物理约束嵌入损失函数或模型架构中,实现数据驱动与物理机制的结合,提升模型的物理一致性与可解释性。混合建模则将动力学模型输出作为机器学习模型的输入,实现模式误差校正、下游变量预测、过程优化等功能,兼顾数据驱动与过程驱动的优势。
来源:科技财经解读