【香樟推文3643】基于点处理的空间因果推断:如何利用CNN确定对

B站影视 港台电影 2025-09-15 11:13 2

摘要:在实证研究中,我们常常关心一个特定“地点”事件的影响。比如,一座新修的地铁站如何影响周边房价?一个新建的公园能否带动附近商家的客流?一家污染工厂对邻近居民的健康有何损害?为回答这些问题,一种流行且直观的方法是将“内环“与”外环”比较:即研究者以事件点为圆心,比

01 引言

在实证研究中,我们常常关心一个特定“地点”事件的影响。比如,一座新修的地铁站如何影响周边房价?一个新建的公园能否带动附近商家的客流?一家污染工厂对邻近居民的健康有何损害?为回答这些问题,一种流行且直观的方法是将“内环“与”外环”比较:即研究者以事件点为圆心,比较“内环”(因距离较近作为处理组)和“外环”(因距离较远作为对照组)的个体结果差异,从而估计政策效应。然而,内环与外环比较的有效性依赖于非常苛刻且难以验证的函数形式假设(例如,潜在结果变量的空间曲面是平坦的),而不能单凭处理位置的随机性得到保证。

为精准识别空间处理效应,Michael Pollmann (师从诺奖得主Imbens) 的研究构建了一套严谨的“基于设计的”(design-based)因果推断框架。该框架的核心思想是比较“真实处理点”邻域的个体与“反事实处理点”邻域的个体。为将这一理想实验付诸实践,论文创新性地提出使用卷积神经网络方法(CNN)来识别和匹配高质量的反事实处理点,并最终结合逆概率加权(IPW)进行估计,为空间因果推断领域提供了一套完整且可靠的解决方案。最后,文章以疫情期间杂货店对餐厅客流量的影响为例,进行了实证应用。结果显示,杂货店对邻近(步行2分钟内)餐厅存在显著的正向溢出效应,平均使其客流量翻了一番,但该效应随距离迅速衰减。

02 为何“内环 vs. 外环”方法不可靠?

“内环 vs. 外环”策略,即通过比较距离处理点 位置的个体结果与距离处理点 的个体结果,来估计空间处理在距离 处的效应,该研究设计的视觉效果如下图所示。其中,橙色圆环的外围可作为对照组,用于估算红色圆心(处理点)在不同距离带宽 位置上的政策效应。

然而,当研究者仅采用截面数据进行“内环vs.外环”比较时,该方法的有效性取决于潜在结果空间分布的函数形式假设——即无处理状态下,潜在结果 的空间分布是平坦性的。然而,这一假设在现实场景中几乎不成立。即便在实践中将 “内环 vs. 外环” 策略与双重差分法结合,其所需的平行趋势假设同样难以满足。以城市房价为例:城市房价通常沿主干道从中心向郊区自然递减,若政府在某一 “准随机” 位置修建公园,此时用 “内环 vs. 外环” 方法比较公园附近与稍远社区的房价变化,所得效应大概率存在偏差。核心原因在于,即便没有公园这一干预,两个 “环” 的房价也会因城市区位差异,本身就存在水平差距或不同变化趋势。

03 提出新思路

接下来,本文构建了一套基于设计的空间因果推断理论。下文设定中,作者将主要以横截面数据形式阐述相关符号与研究结果;该理论框架同样适用于面板数据,仅需将结果变量替换为处理前后的变化量即可。

(一)核心设定

处理与个体的空间分离 :与传统潜在结果框架不同,本文中 “处理” 与 “受处理影响的个体” 相互分离,但共处同一空间。

关键定义

个体 :受处理影响的个体,位置为 (可通过经纬度表示);

处理 :发生于空间位置 的干预;

处理集 :所有处理位置 的集合,满足 ;

潜在结果 :个体 的结果由完整处理集 决定;

边际效应 :在背景 下新增处理 的效应,即: ;

纯粹效应 :从无处理到新增处理 的效应,即: ,且定义 、 ;

已实现处理集 :满足 的实际处理位置集合;

观测结果 :个体 的观测结果,即 ,为依赖 的随机变量;

处理概率 :位置 发生处理的概率,即 ;

距离 :处理位置 与个体位置 的距离(可为驾驶时间或直线距离,需为 “处理前特征”)。

(二)目标参数:平均处理效应(ATT)

本文核心关注目标参数为:距离 处,处理 对被处理者 的期望平均效应(ATT)。由于距离为连续变量,研究者通常将带宽 内的个体分组,定义距离分组权重 ,用于指示个体 是否属于处理 周边的目标组。

纯粹处理效应

式(1)中,分子为所有处理位置与处理个体加总的 “总处理效应期望值”,分母为受影响的 “个体数量期望值”,据此 可表示为平均处理效应。

边际处理效应

式(2)中,分子为总边际效应的期望值,分母为受影响个体数量的期望值。

接下来,作者讨论了两种实践情景。第一种情境是,研究者拥有不同区域的数据,一个区域的处理不会影响其他区域的结果,且每个区域最多有一个已实现的处理位置。第二种情境是,所有数据都来自一个大型区域,该区域既有多个已实现的处理位置,也有未实现的、反事实的处理位置。

(1)核心假设

假设 1(区域分离) :若个体 属于区域 ,则区域

假设 2(区域间分配) :第一阶段随机抽取处理区域,所有 个区域被选为处理区域的概率均等;第二阶段中,若区域 与 均被确定为处理区域,则两区域内具体处理位置 与 的选择相互独立。

假设 3(每区域最多一个处理) :在任一被选中的处理区域 内,最多仅有一个候选位置 会被实际处理。

(2)ATT 参数与估计量构建

在假设 1、2 成立的前提下,ATT 可重写为:

基于公式 (3) 定义的目标参数,采用逆概率加权(IPW)构造加权均值差异(处理组均值 - 对照组均值)以估计该参数,具体形式如下:

处理组均值 :所关注距离 上个体的简单平均

对照组均值 :未处理区域中,反事实处理位置在距离上个体的加权均值。其中,权重

由此,均值差异估计量为:

(3)定理 1 与方差解析 定理 1:

(i) 正则性条件下, ,其中 为不可行估计量;

(ii) 假设 1、2、3 成立时,满足无偏性: ;

(iii) 方差表达式为: 方差各组成部分含义:

:处理区域 内不同候选位置 的潜在结果差异;

:控制组区域 间潜在控制结果 的差异;

:处理组区域 间潜在处理结果 的差异;

:不同区域 间处理效应 的差异。

需注意,此处方差与标准误的不确定性仅源于处理分配的随机性,而非从 “超总体” 抽样的随机性。

(4)权重优化与聚合效应

权重方案优化 :默认 为 0/1 指示变量,即计算均值时所有符合条件的个体 权重相等。但这一设定存在局限:若部分处理地点周边人口密集(个体数量多)、部分地点周边人烟稀少(个体数量少),人口密集地区会对最终平均效应产生更大影响,而这可能不符合研究预期。为此提出两种备选方案:

地点等权方案 :对每个处理地点 赋予相同权重,无论其周边个体数量多少,对平均效应的贡献一致;

核函数平滑方案 :权重在距离 处取 1,向两侧平滑衰减至 0,实现基于距离的梯度分配。

总聚合平均效应计算 :无需关注效应随距离变化时,先估计不同距离对应的,再以 “各距离段内单个处理地点的平均个体数量” 为权重进行加权求和。

推论 1 :假设 1、2 及正则性条件成立,且每区域仅含一个候选位置时, 具有渐近性。这一性质意味着:当样本量(区域数量 )足够大时, 的抽样分布近似正态分布,可通过计算 值、构造置信区间等常用统计工具开展假设检验。

(1)核心假设

假设 4(独立分配) :每个候选位置 的处理状态为独立随机事件,处理概率为 。此假设与上一节假设 2(固定总数随机抽样)的核心差异在于:假设 2 中,若从 100 个城市固定抽取 20 个,A 城市是否被选中会影响 B 城市的选中概率(总数固定),不满足独立性;而假设 4 为 “伯努利试验”,每个候选位置如抛一枚有偏硬币(正面概率 则处理),不同位置的处理结果互不影响。

假设 5(可加性分离效应) :对所有 和 ,满足 。即新增处理 的边际效应恒等于其 “纯粹效应”,意味着处理效应间无交互作用,每个处理的效果独立于其他处理的实现。该假设适用于发电厂对污染暴露影响等物理过程场景。

假设 6(超过距离 后无效应) :对所有 及 ,若 ,则 。

(2)关键定理 定理 2:

估计量 与不可行估计量 近似,后者具备解析易处理的非渐近设计驱动性质:

(i) 标准正则性条件下, ;

(ii) 假设 4、5 成立时, (对 ATT 无偏);

(iii) 假设 4 成立时, (对边际 ATT 无偏);

(iv) 假设 4、6 成立时, 的方差为:

作者进一步指出,降低 “设计驱动方差”(design-based variance)的最有效方式是扩大研究区域,而非在现有区域内提升样本密度(如增加个体或候选点数量)。

04 解决现实难题

上文围绕 “理想实验” 展开理论讨论,但现实中研究者多面对观测性数据,且处理位置(如星巴克选址)并非随机分配,而是由经济、社会等复杂因素决定。直接比较处理位置与非处理位置,易受选择性偏误影响导致估计结果有偏。为解决这一问题,作者提出假设 8:

假设 8(空间无混淆性) :在位置集合 中,若位置 的处理分配在距离 处满足无混淆性,则处理概率 。其中, 为地点 邻域的事前可观测特征(如 1 公里内商家数量、道路网络), 为个体 的事前可观测特征(如收入、消费习惯);核心含义是,地点 的处理概率 仅依赖可观测变量决定的倾向得分,与潜在结果无关。

将空间无混淆性假设应用于实践,需应对两大关键挑战:

倾向得分估计误差 :理想随机实验中 已知,而观测性研究中需自行估计倾向得分 ,但估计过程易受模型设定错误、估计噪音影响,导致结果偏差。

反事实地点匹配难题

空间特征高维复杂:地点邻域特征包含丰富相对位置信息,传统低维统计模型(如逻辑回归)无法有效捕捉精细空间模式;

候选地点数量庞大:连续地理空间中,反事实候选点数量近乎无限,且无完全相同特征的邻域,传统 “精确匹配” 在计算上不可行。

为克服传统方法的局限,作者提出 “空间数据图像化 + 卷积神经网络(CNN)” 的创新思路,具体路径如下:

空间数据图像化转换 :将地理邻域的经纬度映射为图像宽高,将商铺密度、人口分布等空间特征视为图像的不同颜色通道(如 RGB),实现空间信息向图像格式的转化。

CNN 的应用逻辑

任务转化:将反事实对照组寻找转化为图像分类任务,训练 CNN 区分 “真实处理点” 与 “非处理点” 的邻域图像,使其学习处理点特有的空间模式;

高质量对照组筛选:重点关注 CNN 误判为处理点的 “假阳性” 地点 —— 此类地点因在可观测特征上与真实处理点高度相似,可作为优质反事实控制组;

方法适配性:CNN 的卷积操作能有效捕捉局部相对位置关系,权值共享特性实现平移等变性,契合 “关注相对特征而非绝对坐标” 的经济学直觉。

最后,为应对倾向得分估计误差,作者采用双重稳健估计量 —— 只要倾向得分模型与结果模型中至少一个设定正确,对 的估计即可保持一致性。

05 实证应用

文章将前文提出的 “CNN 空间匹配方法” 应用于现实问题研究:2020 年 COVID-19 疫情期间,美国旧金山湾区推行 “就地避难” 政策,仅允许居民开展购买生活必需品等有限活动,这一政策对依赖客流的餐饮行业造成严重冲击。本研究核心探讨的问题是:位于杂货店这类 “必需场所” 附近的餐厅,是否可能借此获得更多客流量?

为回答该问题,作者采用前文构建的 CNN 模型,在湾区地图上为真实杂货店匹配了大量环境特征高度相似的 “反事实杂货店” 位置(示意图如下)。图中各元素含义如下:

处理单元(treatment units) :红色实心三角,代表研究范围内的杂货店(含真实杂货店与反事实 “候选处理点”);

结果单元(outcome units) :黑色圆圈,代表作为研究对象的餐馆;

协变量来源 :绿色方块,代表其他商业场所,用于构建邻域特征协变量;

空间离散化方式 :黑色网格,展示作者将连续地理空间离散为网格单元(grid cells)的处理过程;

距离定义 :围绕杂货店绘制的半径 0.05、0.10、0.15 英里的同心圆,用于划分不同距离段的餐馆组(如 “0-0.05 英里范围内的餐馆”)。

如图 5 所示(横轴为距离段,纵轴为效应点估计值及 95% 置信区间),杂货店对餐馆客流量的正向溢出效应呈现 “强局域化” 特征, 仅局限于步行 2-3 分钟的超近距离内,超出该范围效应即消失。

06 总结

至关重要地,文章强调其框架并不局限于地理空间。该理论可推广至任何“处理”与“个体”分离,并通过可观测的抽象“距离”相联系的非空间设定。例如,在产品特征空间中研究新产品进入对现有公司的影响,或在产业结构空间中评估行业冲击(如Bartik方法)对不同城市的影响。这一扩展极大地提升了该方法的普适性,为处理各类复杂溢出和干扰问题提供了强大的理论与计算工具。 最后,这篇计量文章的在应用上的理解可见香樟推文: https://mp.weixin.qq.com/s/XZP86dZmj1FUzSGiFntqKA 。

Abstract

Many events and policies (treatments) occur at specific spatial locations,with researchers interested in their effects on nearby units of interest. I approach the spatial treatment setting from an experimental perspective: What ideal experiment would we design to estimate the causal effects of spatial treatments? This perspective motivates a comparison between individuals near realized treatment locations and individuals near counterfactual (unrealized) candidate locations, which differs from current empirical practice. I derive design-based standard errors that are straightforward to compute irrespective of spatial correlations in outcomes. Furthermore, I propose machine learning methods to findcounterfactual candidate locations using observational data under unconfounded assignment of the treatment to locations. I apply the proposed methods to study the causal effects of grocery stores on foot traffic to nearby businesses during COVID-19 shelter-in-place policies, finding a substantial positive effect at a very short distance, with no effect at larger distances.

来源:古畔听史

相关推荐