聚焦“GAI”时代计量经济学前沿,耶鲁大学陈晓红教授进行分享

B站影视 欧美电影 2025-06-06 10:44 2

摘要:2025年5月28日,美国艺术与科学学院院士、耶鲁大学Malcolm K. Brachman经济学教授陈晓红受邀莅临北京大学光华40年“顶尖学者学术讲堂”,分享了她的研究On Local Over-identification and Semiparametr

现场合影

2025年5月28日,美国艺术与科学学院院士、耶鲁大学Malcolm K. Brachman经济学教授陈晓红受邀莅临北京大学光华40年“顶尖学者学术讲堂”,分享了她的研究On Local Over-identification and Semiparametric Efficiency in Potential Outcome Casual ModelsEfficient Difference-in-Differences and Event-Study Estimators。她结合大数据与机器学习技术对传统经济学研究的冲击,系统地揭示非参数过度识别模型在提升因果推断效率与检验效能中的重要作用,为生成式人工智能(GAI)时代的复杂经济分析提供了新范式。北京大学光华管理学院商务统计与经济计量系主任、教授虞吉海主持了本次活动。

虞吉海

On Local Over-identification and Semiparametric Efficiency in Potential Outcome Casual Models

在GAI与大数据技术蓬勃发展的今天,仅凭传统依赖数据相关性的分析而缺乏有效的经济模型,难以揭示变量间的因果关系。而构建科学的经济因果模型成为破解这一难题的核心路径。陈晓红指出,半非参数模型既能避免完全参数化模型的函数形式错误,又能比完全非参数模型提供更有信息量的估计与推断,还支持过度识别的模型设定检验,因此具有更多优势。她在2018年的研究中就提出了局部过度识别定义,认为过度识别是经济计量模型获得有效估计量的重要条件,同时也是构建非平凡模型检验的基础。并进一步指出,局部过度识别的模型中存在显著的有效性增益和非平凡的检验,这体现了经济模型设计中的效率和检验能力之间的本质联系。

陈晓红

陈晓红进而分析了不同因果推断模型的识别状态与效率界存在差异。未混淆模型(unconfoundedness)为全局恰好识别模型,不存在效率增益,Hahn (1998) 与 Hahn 和 Ridder (2013) 分别提出了非参数插补法与倾向得分匹配法,都能达到半参数效率界。然而当倾向得分已知时,模型变为局部过度识别,但效率界未改变,反映出特定条件下模型识别状态不一定影响效率界;双重差分(DiD)模型在两期数据情景下是全局恰好识别模型,多期或交错处理时可能出现局部过度识别,进而获得显著效率增益与非平凡检验能力,这在现代DiD方法应用中多有采用。伴随着多期数据引入能够更有效利用历史数据,从而提升估计精准性和检验可靠性;工具变量(IV)模型的局部识别状况取决于约束条件是否紧密。当约束条件在一定测度集合上严格成立时,局部模型为过度识别,可采用更有效估计策略。若约束条件不严格,则模型为局部恰好识别,不存在效率增益空间。因此,对约束条件的严格性分析是IV模型应用中的重要步骤。

研究表明,传统因果推断框架中的局部过度识别通常依赖于干扰参数的参数化建模实现,但此类模型面临双重局限:一方面缺乏坚实的理论支撑与实践依据,另一方面在机器学习技术盛行的背景下,其参数化假设与非结构化数据特征的兼容性不足,导致应用场景日益受限。现代因果推断文献大多属于局部恰好识别范畴,限制了规范检验的有效性与估计效率的提升空间。与之形成对比的是,传统参数化结构模型通过明确的过度识别约束设定,能够系统地整合多重矩条件,从而实现估计效率的提升与非平凡检验体系的构建。上述研究发现揭示了一个重要方法论启示:在高维数据与复杂因果推断需求交织的现代分析框架下,需强化对模型过度识别的理论探索与实证应用,通过挖掘数据隐含的约束条件优化识别策略,进而提升因果分析的稳健性与效率边界。

Efficient Difference-in-Differences and Event-Study Estimators

在最新的研究中,陈晓红提出了一种高效的双重差分(DiD)与事件研究(Event-Study)估计方法。DiD和ES是计量经济学中广泛应用的因果推断工具,但存在如处理前时期信息使用缺乏依据易导致精度损失、有限样本功效未系统评估、多种结果报告缺乏判断准则等若干关键计量问题。

文章提出统一框架,在“平行趋势+无预期”假设下对DiD与ES进行半参数效率分析和比较。研究以观测变量联合分布约束重述DiD识别,在多场景下推导半参数效率界,证明达效率上界需对处理前时期与未处理组非均匀加权,指出即便在最简单设计中效率提升亦具有实证意义。进而证明了DiD模型在非参数意义下通常过度识别,可利用额外矩条件提高效率。在“大n、固定T”框架下,研究基于有效影响函数构建封闭式估计量,其权重与各比较组及各处理前时期的(条件)协方差成比例,天然满足 Neyman 正交,便于与机器学习配合。效率界表明等权使用前期或仅选最后一期做基线通常非最优,应按信息量差异以协方差驱动权重聚合。此外,陈晓红在研究中提出无需附加同方差或序列相关假设的非参数 Hausman 类检验,用于检测是否应排除某些前期基线或比较组,并给出可视化方案评估结果对识别假设的敏感度。

该研究与现有多时期、异步处理的DiD估计量形成互补。传统双向固定效应模型因对处理效应异质性的刻画局限,在多期数据场景中易导致权重混合偏误,而对时间维度或组别特征的简化假定进一步引发信息损耗与效率损失。本研究构建的半参数效率界理论框架,为评估不同估计方法的有效性提供了统一基准,助力研究者在模型设计中实现效率-稳健性的动态权衡。此外,研究将DiD与ES的识别信息进行系统化刻画,提出渐近达到信息理论极限的高效估计量,并开发配套的非参数检验工具与可视化分析方案,为因果推断实践提供了兼具统计精度与操作便捷性的全新方法论路径。

在GAI时代背景下,随着经济计量学与人工智能的深度融合,非参数过度识别与有效学习的重要性日益凸显。这一前沿领域不仅能够显著提升模型估计的效率与精准度,更为未来的因果推断和政策分析构筑了更坚实的理论根基与方法支持。在演讲尾声,陈晓红强调,未来研究需进一步探索多维经济场景中模型的局部过度识别的实现路径,充分挖掘数据潜在信息、提升分析效能;同时构建跨模型设定的有效性边界分析框架,持续开发更灵活、强健的检验方法,以适配复杂多变的现实经济情境下非线性、高维动态的因果推断需求。

在学术对话环节,陈晓红与在场学者就过度识别模型下的工具变量优化配置、机器学习算法与半参数模型的耦合机制等前沿问题展开了深入的交流与研讨。活动最后,虞吉海代表主办方为陈晓红赠予活动纪念牌,诚挚地感谢其带来的前沿学术分享。

赠送纪念牌

为加快推进“双一流”优势学科建设及学科高质量发展,落实2030年整体达到世界顶级商学院研究水准并兼具中国特色的建设目标,光华管理学院以40周年院庆为契机,推出“顶尖学者学术讲堂”系列活动,邀请全球顶尖学者和权威专家来院举办讲座和交流活动,旨在深度探索经济学和管理学领域的重要科学问题和前沿问题,鼓励跨学科创新,拓展研究范式边界,启迪新的思想理念,加强国际前沿学术交流,提升学术研究的国际影响力。

The "Top Scholar Forum" series, launched to celebrate the 40th anniversary of the Guanghua School of Management and promote the high-quality development of academic disciplines, brings together top scholars and experts from around the world. Through lectures and academic exchanges, the forum focuses on frontier issues and key topics in economics and management, employing innovative academic paradigms and scientific methodologies. It encourages interdisciplinary innovation and the exploration of practical challenges, showcasing the latest research and sparking new ideas and perspectives. This international platform for academic dialogue aims to enhance Guanghua’s academic contributions and further elevate its global influence in the fields of economics and management.

来源 | 北大光华学术资讯

编辑 | 王蒙

审阅 | 塔娜

近期发布:

全球视野下的人工智能治理研讨会在北京大学举办

来源:光华管理学院

相关推荐