【香樟推文3550】美国经济学年会杰出讲座:算法时代的经济学

B站影视 港台电影 2025-06-11 11:43 1

摘要:在美国经济学年会(AEA Annual Meeting)的众多环节中,杰出讲座(Distinguished Lecture)历来是学界关注的焦点,它通常由对经济学特定领域做出过重要贡献的学者主讲,旨在分享深刻的洞见并引发对学科前沿问题的思考。2025年1月3日

01

引言

在美国经济学年会(AEA Annual Meeting)的众多环节中,杰出讲座(Distinguished Lecture)历来是学界关注的焦点,它通常由对经济学特定领域做出过重要贡献的学者主讲,旨在分享深刻的洞见并引发对学科前沿问题的思考。2025年1月3日,芝加哥大学的Sendhil Mullainathan教授受邀发表了题为“算法时代的经济学”(Economics in the Age of Algorithms)的演讲,其讲稿随后以论文形式正式发表于最新一期的《AEA Papers and Proceedings》。

在这篇纲领性的文献中,Mullainathan教授以一个极具启发性的历史对比,拉开了他核心论证的序幕。他指出,在经济学的历史演进中,技术变革通常被视为一股外生力量,它改变着生产的可能性,却很少直接触及这门学科分析问题的核心框架。一个多世纪前的电力革命虽然重塑了工业的面貌,但我们并未因此迎来一个所谓的“电力时代的经济学”。这是因为,无论是新古典经济学的效用最大化原则,还是企业的成本最小化逻辑,其理论的抽象性足以将电力的影响轻松纳入其中,而无需对理论本身进行修正。

Mullainathan接着提出了一个深刻而极具挑战性的观点。他认为,算法,特别是机器学习的崛起,与历史上的任何技术都截然不同。其颠覆性不在于改变了我们“做什么”,而在于它正在从根本上重塑我们“如何做决定”。因为经济学的本质是研究人类决策及其后果的科学,当决策这一构成整个经济学大厦最基础的构件发生了革命性变化,那么建立在其之上的理论体系也必然面临一场深刻的范式重塑。

因此,Mullainathan的这篇讲座,与其说是一份对未来的预测,不如说是一份写给所有经济学研究者的行动指南与方法论警示,它系统性地探讨了人工智能时代经济学的演进方向,并为我们提供了重要的思想框架。

02

解释“为什么”与预测“会怎样”

要理解算法带来的影响,有必要首先回顾经济学研究中两种并存但目标各异的分析范式:因果推断(Estimation)与结果预测(Prediction)。

在传统计量经济学中,研究者的主要目标通常是进行因果推断。对于一个经济模型,核心关切在于识别并估计出某个变量对另一个变量的净影响,即“厘清因果关系”。例如,“班级规模缩小对学生平均成绩的具体影响有多大?”这类问题,追求的是对经济结构和机制的理解,是理论验证和政策效果评估的基础。

与此相对,机器学习,特别是监督学习算法,其核心目标是进行结果预测。它的任务是利用所有可获得的信息,去构建一个能够最小化预测误差的模型。它更关心“结果会怎样”,而非“为什么会这样”。例如,“综合一个学生的全部背景信息,其期末考试成绩的预测值是多少?”在这个任务中,预测的准确性是首要标准,而模型内部复杂的运算机制则通常不作深究。

作者在文中指出,这两种方法论之间的关系并非简单的替代,而是互补的。在许多高维或变量间存在复杂关联的现实场景中,精确识别出每一个因素的独立作用可能非常困难。但这并不意味着无法做出准确的预测。变量之间的相互关联性,本身就为最终结果提供了信息和约束。

上图直观地展示了因果推断与结果预测之间的关系。图1和图2描绘了一种情境:由于数据信息的限制,我们可能无法精确地估计出单个变量的影响,其参数的置信区间非常宽泛,使得因果推断面临挑战。然而,图3揭示了关键点:在变量存在相关性的情况下,它们的联合作用会受到约束。这意味着,即便单个参数的影响存在不确定性,它们共同产生的预测结果却可能相当稳定和精确。这一观点表明,有效的预测能力,并不必然以精确的因果识别为前提,这为算法在信息不完全的经济场景中的应用,提供了理论基础。

03

“预测型政策问题”的潜在价值

基于“因果”与“预测”的区分,作者提出了“预测型政策问题”这一核心概念,并指出这类问题在经济社会中普遍存在,但其独特性质可能未得到经济学研究的充分关注。

一个“预测型政策问题”的典型特征是,决策者采取行动的目的,并非要从因果上改变某个结果,而是要基于对该结果的预测,来做出最优的资源配置或管理决策。文中的核心案例,法官的审前释放决策,清楚地说明了这一点。根据法律规定,法官在审前阶段的核心任务是评估被告的风险,而非通过干预来改变其风险。法官需要预测被告如果被释放,其未来弃保潜逃或再次犯罪的可能性有多高,然后依据这个预测结果来做出羁押与否的决定。与之相对,一个典型的因果政策问题是评估“电子监控能否有效降低再犯率”,其决策依据必须是关于干预措施的因果效应研究。

上图通过因果图的形式,清晰地区分了这两种问题。在因果问题中,决策直接指向并试图影响结果。而在预测问题中,决策的制定依赖于对结果的预测,其本身并不改变该潜在结果,而是直接影响最终的收益或成本。

作者认为,这类问题潜藏在经济学研究的各个领域。

上表系统性地梳理了经济学各领域中存在的“预测型政策问题”,并将其分为三类,展示了其普遍性与重要性。

第一类是“我们已在研究,但忽略了其预测成分的决策”。例如在教育经济学中,我们投入大量精力研究班级规模对学生成绩的因果效应,却相对忽视了另一个同等重要的决策环节:如何从众多申请者中挑选出最优秀的教师?这本质上是一个预测教师未来教学表现的问题。同样,在健康经济学中,对医生是否存在“道德风险”的研究,往往也隐含了一个前提,即医生已经准确地预测了患者的健康风险,而事实可能并非如此。

第二类是“我们已在研究,但忽略了其中依赖预测的决策”。例如在金融领域,除了研究宏观政策,银行的核心业务之一是进行信贷审批,即预测哪个借款人未来会按时还款。在公共财政领域,除了设计税制,税务部门的关键执行环节是如何预测并审计最有可能存在偷漏税行为的报税单。

第三类是“我们很大程度上忽略的领域,因为其核心是预测问题”。例如人道主义援助,核心挑战是如何预测灾难发生的地点和时间,以实现最高效的资源投放。

这个表格揭示出,预测不仅是经济活动的一部分,它本身就是一个值得被严肃研究和优化的经济学核心问题。算法的出现,为系统性地研究和改进这些高频发生、以预测为核心的决策,提供了新的可能性。

作者在文章中进一步指出,关注并解决“预测型政策问题”不仅具有理论上的重要性,更蕴含着巨大的、甚至超乎寻常的社会福利改进空间。为了量化这一观点,论文引入了公共财政领域的“公共资金边际价值”(Marginal Value of Public Funds,MVPF)框架,这是一个用于标准化衡量各类政策“性价比”的指标,即政策产生的社会总收益与其给政府带来的净成本之比。

上图将一系列传统公共政策的公共资金边际价值,与几项基于算法的预测型干预政策进行了直观比较图中的每一个点代表一项政策研究。我们可以清晰地看到,绝大多数传统政策的价值分布在一个相对集中的区域,而少数几项算法干预政策,例如纽约市的审前释放决策辅助、大学课程推荐和心脏病风险筛查,则显著地位于图表的顶端。它们的公共资金边际价值极高,有些甚至达到了无穷大,这意味着这些政策不仅能创造巨大的社会效益,同时还能为政府节省开支。这一结果表明,通过算法优化预测决策,可能带来非线性的、数量级上的效率提升。

那么,这种“超乎寻常的有效性”究竟从何而来?作者认为,除了人类决策本身存在改进空间这一显而易见的因素外,还有一个更深层次、也更常被忽视的经济学逻辑,即“排序改进”所带来的福利增益。论文通过图6和图7的对比,对此进行了精辟的阐释。

上图则展示了引入算法进行“重新排序”后,情况发生的根本性变化。算法通过更精确的预测,识别出那些真正能从政策中获益最大的群体,并将其排在最前面。这使得边际收益曲线本身变得更加陡峭。在这种情况下,福利的增益来自于两个层面。首先,即便政策的总体覆盖面保持不变,仅仅通过优化服务对象的次序,就能凭空创造出一块可观的福利净增。其次,当政策进一步扩张时,由于新的受益群体依然是经过更优排序筛选出来的,其边-际收益也将高于原始排序下的水平。

04

算法时代的经济学家

算法的引入,一方面对经济学家的研究方法提出了新的挑战,另一方面也为其提供了新的研究工具。

在算法的评估与应用层面,作者强调了两个源自因果推断思想的根本性挑战。第一个是“选择性标签”问题,这是一个固有的数据缺失问题。在法官的例子中,我们只能观察到被释放被告的后续行为,而被羁押被告的“反事实”结果,即如果他们被释放会怎样,是无法观测的。在这种情况下,任何对算法和人类决策的简单比较都可能因样本选择偏误而产生误导。如何设计严谨的识别策略,以获得更可靠的评估,是经济学家需要解决的问题。

第二个挑战,作者称之为“忽略支付偏差”问题。这个问题触及了一个更深层次的对齐难题:我们作为研究者,为算法设定的那个清晰、量化的优化目标,与现实世界中决策者内心那杆复杂的、可能包含多种权衡与价值判断的判断标准,是否真的完全一致?

举例来说,一个算法可能被设定去优化一个笼统的“再犯率”,即预测并最小化任何形式的再次犯罪。但一位经验丰富的法官,其内心的目标函数可能远比这复杂。他或许对涉及人身伤害的暴力犯罪赋予极高的负权重,而对轻微的财产犯罪或交通违章则相对容忍。在这种情况下,如果一个算法仅仅因为能更准确地预测出那些轻微罪行的“高风险”人群而表现“优异”,它的这种“优越性”就可能是一种假象,因为它并未真正理解和对齐决策者最为关切的核心价值。因此,如何洞察、识别并严谨地将这种潜在的目标偏差纳入模型,对算法的价值做出更公允的评估,这需要经济学家敏锐的洞察力与精巧的建模能力。

除了带来评估上的挑战,算法的角色也可以从一个决策辅助工具,拓展为一个科学发现的工具。作者及其合作者的研究展示了如何利用算法进行假说生成。他们训练了一个复杂的神经网络来预测法官的决策,并将被告的面部照片作为输入变量之一。结果显示,某些面部特征是预测判决结果的强力变量。这个由算法从数据深处“挖掘”出的假说,为司法偏见研究提供了新的、可供验证的切入点。他们进一步通过技术手段,将模型中抽象的信号,转化为人类可直观感知的合成面部图像,展示了哪些细微的面部变化与更严厉的判决相关。

05

当算法成为经济学研究的一部分

如果说前文的论述主要将算法定位为一个经济学家可以利用的、充满机遇的外部工具,作者接下来提出了一个更具颠覆性的论断:算法正迅速地从经济学的研究工具,演变为经济学研究的对象本身。将其纳入经济学分析,将从一种“机遇”转变为一种“必然”。这一转变的根本驱动力,并非来自学者的选择,而是源于我们所研究的经济主体,即真实世界中的人与企业,将日益广泛地采纳算法来进行决策。

为了阐明这一深刻的转变,作者以一个经济学中的经典模型,失业者的求职搜寻,作为思想实验的载体。在传统模型中,一个失业者会基于自己对自身能力、市场状况的(不完美)预测,以及对工作偏好和保留工资的考量,来决定向哪些职位投递简历。公共财政经济学家则在此基础上,研究失业保险(UI)福利水平如何影响其求职努力,即所谓的“行为弹性”。这个弹性,在很大程度上被视为一个反映人类内在动机与偏好的、相对稳定的结构参数。

然而,现在想象一下,一个算法驱动的求职推荐系统被引入到这个过程中。这个系统,能更准确地为求职者预测其与职位的匹配度,并推荐成功率最高的选项。此时,求职者的决策过程发生了根本性的改变,它不再是个人独立的搜寻,而是人与算法的互动。

这里便引出了整篇论文最核心的洞见之一。一旦求职者开始依赖算法,之前测算出的“行为弹性”参数,就不再稳定,也不再纯粹地反映人类的“真实”偏好。它会随着算法的推荐逻辑、目标函数的改变而变化。例如,一个旨在最大化录用率的算法,可能会引导求-职者做出与一个旨在最大化长期薪酬的算法截然不同的选择。这意味着,那个曾经被我们视为外生、稳定的行为参数,如今内生化于包含了算法的整个政策与技术环境之中。

这就带来了一个对经济学研究和政策制定都极为深远的启示。当行为参数本身依赖于我们引入的政策工具(在这里是算法推荐系统)时,传统的政策分析框架就可能失效。政策制定者不能再简单地将算法视为一个固定的技术背景,去单独优化失业金的发放方案。相反,算法的设计本身,也必须被视为与福利水平、领取期限同等重要的政策变量,进行联合优化。

这是否意味着经济学家都必须成为计算机科学家?作者的回答是否定的。他指出,一个由计算机科学家构建的“原生”推荐算法,可能只会基于历史数据进行模式匹配,而完全忽略了经济学家最为关切的问题:比如,如果所有人都被推荐去申请少数几个热门职位,是否会引发市场拥堵?求职者在获得更好的推荐后,是否会产生新的道德风险?是否存在某些行为偏误,使得求职者过度信赖或错误使用算法?

因此,设计一个真正有效的、能够提升社会总福利的求职算法,其核心挑战并非计算问题,而是一个不折不扣的经济学问题。它要求我们将市场均衡、激励机制和行为洞察等经济学原理,内嵌到算法的设计之中。

最终,这一部分有力地论证了“必然性”的来源:当经济本身日益“算法化”,当无数个微观决策都开始由人与算法共同塑造时,任何试图忽略算法的经济学模型,都将面临严重的模型设定偏误。为了继续准确地理解和解释世界,经济学自身,也必须拥抱算法,将其从外生变量,内化为理论的核心。

06

结语

作者在文末以一个精妙的比喻,为这场关于算法与经济学的对话画上了句点。他将科学学科的成长路径比作城市的扩张:一种是“向上”生长,如同物理学,在既有的疆域内不断深耕,将理论的大厦建得愈发精确和雄伟;另一种则是“向外”扩张,如同心理学,不断开拓全新的研究领域,让学科的版图日益辽阔。而经济学,恰恰是少数能够同时在这两个维度上齐头并进的学科。

算法,正是推动经济学进行新一轮波澜壮阔的“向外”扩张的强大力量。它与历史上的博弈论、信息经济学、行为经济学乃至“可信度革命”一样,其真正的价值不仅在于为我们研究旧问题提供了更强大的新工具,更在于它揭示了大量过去被我们技术性忽视、但其重要性与深刻性丝毫不亚于经典问题的全新研究领域。

从优化高频的预测型决策,到作为科学发现的引擎生成新假说,再到最终内化为经济系统的一部分,算法正在重塑经济学研究的对象、方法与边界。面对这一历史性的范式转移,最初可能会出现的“这还是经济学吗?”的疑问,终将随着研究的深入和成果的涌现,被一个更为肯定的陈述所取代。因为当新的问题被证明是深刻且重要的,那么拓展疆域去容纳它们,便不是对学科的背离,而是其生命力最鲜活的体现。

来源:老夏看商业一点号

相关推荐