摘要:非线性动态系统在自然界中无处不在,且难以预测。这些系统对初始条件的小扰动可能十分敏感,并且通常由多个尺度的过程组成。基于李雅普诺夫谱的经典方法依赖于对动态前向算子的了解或其数据导出的近似。不过,这个算子通常是未知的,或者数据噪声太大,无法获得其真实表示。在这里
摘要
非线性动态系统在自然界中无处不在,且难以预测。这些系统对初始条件的小扰动可能十分敏感,并且通常由多个尺度的过程组成。基于李雅普诺夫谱的经典方法依赖于对动态前向算子的了解或其数据导出的近似。不过,这个算子通常是未知的,或者数据噪声太大,无法获得其真实表示。在这里,我们提出了一种数据驱动的方法来分析动态系统的局部可预测性。这种基于递归概念的方法与局部动态指标的成熟框架密切相关。应用于理想化系统和来自大规模大气场的真实数据集时,我们的方法在估计局部可预测性方面证明了其有效性。此外,我们讨论了它与其他局部动态指标的关系,以及它如何揭示可预测性的尺度依赖特性。进一步地,我们探讨了它与信息理论的联系,包含加权策略的扩展以及实时应用。我们相信这些方面共同展示了它作为复杂系统强大诊断工具的潜力。
论文题目:Time-lagged recurrence: A data-driven method to estimate the predictability of dynamical systems
论文链接:https://www.pnas.org/doi/abs/10.1073/pnas.2420252122
发表时间:2025年5月16日
论文来源: PNAS
从天气变化到生态系统演化,自然界中大多数复杂系统的行为都遵循非线性动力学规律。这些系统的核心特征之一是混沌性 (chaos) :微小的初始扰动可能导致长期预测的彻底失效。传统上,科学家依赖 李雅普诺夫指数(Lyapunov exponents)等全局指标评估系统的平均可预测性 ,该指数描述了相邻轨迹的指数发散速率, 无法捕捉状态依赖的局部特性 (state-dependent local properties) ,例如,大气环流在某些区域可能比另一些区域更容易预测。如何从观测数据中直接提取局部可预测性信息,成为动力系统研究的重要挑战。此外,现有方法多依赖于系统动态方程的线性近似,难以处理非线性效应主导的有限扰动。近期,一项发表于 PNAS 的研究提出了一种名为 时间延迟递归 (time-lagged recurrence,TLR) 的数据驱动方法,为这一难题提供了创新解决方案。
本文提出的时间滞后递归 (TLR) 方法摒弃了对系统模型的依赖,直接从观测数据中提取局部可预测性信息。其核心思想是:通过相空间中状态的“递归” (recurrence) 量化系统的稳定性。具体而言, 对于一个参考状态 ζ ,研究者首先识别其邻近状态(称为“递归点”),然后追踪这些邻近状态在未来某一时间窗口 η 内的演化轨迹。 若多数邻近轨迹在时间 η 后仍接近参考状态的未来位置,则表明该状态具有高可预测性;反之则意味着低可预测性。
TLR方法的三步框架
1. 递归点识别 :利用极端值理论 (extreme value theory) ,通过距离分布的分位数阈值 (quantile threshold) 筛选参考状态的邻近点,避免噪声干扰 (图 1 蓝色实心点) 。
2. 未来状态追踪 : 将递归点向前演化至时间窗口 η ,生成“前向递归点” (forward recurrences,图 1 蓝色空心点) ,并与参考状态的未来邻域 (forward-reference-state recurrences,图 1 橙色空心点) 进行匹配。
3. 可预测性量化计算匹配比例值得注意的是,TLR通过分位数阈值自适应调整邻域尺度,能够揭示不同空间尺度下的可预测性特征。例如,小尺度邻域可能反映短期扰动的影响,而大尺度邻域则对应系统长期演化的稳定性。
短期预测窗口 (如 ,
为该系统的李雅普诺夫时间):吸引子两翼 (wings) 的可预测性较高,而轨迹切换区域 (lobe-switching region) 的
值相对较低。
长期预测窗口 (如 ):随着时间窗口增加,整体可预测性急剧下降,但部分中间区域可保持相对稳定。
进一步聚类分析表明,可预测性的空间异质性与系统的动力学特性一致。例如,吸引子两翼的轨迹虽易快速离开邻域 (低持久性,low persistence) ,但因发散速度较慢,仍表现出较高的短期可预测性。这一结果挑战了传统观点——低持久性必然对应低可预测性。
大气环流:天气模式的预测瓶颈
在真实数据验证中,研究者聚焦欧洲-大西洋区域的500百帕位势高度场 (Z500) ,分析冬季天气型 (weather regimes) 的可预测性差异。结果显示:
北大西洋涛动负相位 (NAO−) 的可预测性最高,其次是正相位 (NAO+) 。
阻塞型天气 (如斯堪的纳维亚阻塞,Scandinavian Blocking) 的 值最低,与已知的阻塞高压难以预测的现象一致。
图 3. 北大西洋冬季天气状况的可预测性分析。
这一发现不仅与气候模式 (climate models) 的预测结果吻合,还揭示了TLR在高维复杂系统中的实用性——无需降维或简化假设,直接从原始数据中提取局部信息。
TLR方法的一个关键优势在于其与信息论的天然联系。研究者证明,与经典指标 (如非线性局部李雅普诺夫指数,NLLE) 的对比显示,TLR在非线性区域的表现更优。例如,NLLE假设误差呈指数增长,而TLR通过递归点的实际演化直接捕捉非线性效应。此外,TLR能够揭示可预测性的“非单调衰减”——在某些时间窗口,系统可能因吸引子结构出现短暂的可预测性回升。
尽管TLR依赖于未来状态信息, 无法直接用于实时预测,但研究者提出了一种历史相似性代理法 。通过搜索当前状态的“历史相似状态”并计算其平均时间滞后递归 (TLR) 的提出,标志着数据驱动方法在动力系统研究中的一次重要突破。它不仅克服了传统指标对模型和线性近似的依赖,还为高维复杂系统 (如大气环流、生态系统) 的局部可预测性分析提供了通用框架。未来,结合机器学习与极端值理论,TLR有望在气候预测、灾害预警等领域发挥更大价值。
来源:科技财经解读