摘要:近日,美国麻省理工学院研究团队开发了一种新算法,可以应用于各种情况以识别复杂系统中的变量因果关系。它以算法的形式处理收集到的数据,例如海洋环境中不同物种数量的变化。该算法可以测量不同系统中每个变量之间的相互作用,通过一个变量的变化(例如,一个地区随时间推移的沙
本报综合外媒报道 因果关系是科学研究的核心,但在现实世界中,对一个结果展开追踪溯源是一件棘手的事情,因为许多变量会混淆在一起并掩盖其中的因果关系。
近日,美国麻省理工学院研究团队开发了一种新算法,可以应用于各种情况以识别复杂系统中的变量因果关系。它以算法的形式处理收集到的数据,例如海洋环境中不同物种数量的变化。该算法可以测量不同系统中每个变量之间的相互作用,通过一个变量的变化(例如,一个地区随时间推移的沙丁鱼数量)预测另一个变量的状态(例如同一地区的凤尾鱼数量)。然后,通过生成一个“因果关系图”将可能具有某种因果关系的变量联系起来。在此基础上,该算法还会进一步明确不同关系之间的具体性质,例如两个变量之间的关系是协同的(即一个变量只有在与其他变量配对时才会影响第二个变量)还是冗余的(即一个变量的变化可以与另一个变量产生完全相同的影响)。
新算法还可以估计“因果泄露”,即根据现有信息无法预测系统行为存在的一些未知的影响所起到的作用。该算法存在的意义在于其跨学科的通用性。例如,学者可以利用该算法更好地理解生态系统中物种的进化、大脑中神经元的交流或地区之间气候变量的相互作用。
近年来,有许多计算方法被开发出来,用来分析复杂系统中的数据并识别系统中变量之间的因果关系。麻省理工学院航天航空学助理教授阿德里安·洛萨诺-杜兰(Adrián Lozano-Durán)认为,“不同的方法采用了不同的数学定义来明确因果关系,有很多定义听起来都不错,但在某些情况下可能会失效”。现有的方法无法用以区分某些特殊类型的因果关系,比如不能对协同或冗余关系进行区分,无法辨识出“独特”的因果关系,即一个变量对另一个变量具有独特的影响。还有一些方法通过变量的强度来衡量因果关系,这种方法可能会忽略掉一些变量之间的联系,这些变量的强度或许不强,但其实很重要。
在新算法中,研究人员借鉴了信息论理论。洛萨诺-杜兰说,“我们将系统视为一个网络,变量以一种可测量的方式相互传递信息,如果一个变量向另一个变量发送信息,这意味着它一定产生了某些影响。这是我们用信息传播来衡量因果关系的初衷”。
新算法可以同时计算多个变量,而不是像其他方法一样一次计算一对变量。新算法生成的因果关系图可以显示网络中哪些变量是紧密相连的。凭借这些关联的速度和模式,研究人员可以区分哪些变量之间构成了独特的、协同的或冗余的关系。通过同样的方法,该算法还可以估计系统中“因果泄露”的程度。
该团队将其算法应用于许多通常用于测试因果推理的基准案例。这些案例包括观察捕食者和猎物之间的相互作用、测量不同地理区域的气温和气压以及海洋环境中多种物种的共同进化等。与大多数只能处理特定情况的方法相比,新算法成功地识别了每种情况下的因果关系。研究团队将其命名为“协同—独特—冗余因果关系分解”(SURD)。SURD有潜力推动多个自然科学和社会科学领域的进步,如气候研究、神经科学、经济学、流行病学和流体动力学等。
(杨蓝岚/编译)
本文来自【中国社会科学网】,仅代表作者观点。全国党媒信息公共平台提供信息发布及传播服务。
来源:人民日报党媒平台