唐世平团队“抢政治学者饭碗”:计算机辅助预测美国大选?

B站影视 2025-01-03 05:00 3

摘要:其实,唐世平算得上中国社会科学界最桀骜不驯的学者之一。十几年前的访谈里,青年时代的唐世平话语“轻狂”,他自比20世纪最伟大的哲学家波普尔(Karl Popper),宣称要成为“21世界最重要的社会科学家之一”。

计算机通过大数据搭建选民模型,提前预测特朗普胜选。(黄雨婕使用AI工具生成/图)

57岁的唐世平不称自己是“神人”了,尽管他领着十余人的团队“比较成功地”预测了几届大选。“我努力的动力主要是挑战自己的智力(极限)。”他略带自夸地说。

其实,唐世平算得上中国社会科学界最桀骜不驯的学者之一。十几年前的访谈里,青年时代的唐世平话语“轻狂”,他自比20世纪最伟大的哲学家波普尔(Karl Popper),宣称要成为“21世界最重要的社会科学家之一”。

唐世平学术生涯的大转向始于1995至1996年的“台海危机”。那年,他从美国韦恩州立大学医学院分子生物及遗传学刚刚毕业不久在做博士后,带着“学生物不能救中国”的使命感,他从自然科学转向社会科学。

后来,从国际政治、比较政治扩展到制度经济学、政治(学)理论及计算社会科学的唐世平,开始“用计算机科学预测美国大选”。2013年复旦大学复杂决策分析中心成立后,唐世平试图将计算社会科学引入政治决策,这让传统政治学界再次看到了他的“狂”。

虽然唐世平团队在具体摇摆州预测略有偏差,但屡次命中总统当选人又让旁人深感好奇:他为什么要用计算机预测大选?他们团队是如何预测的?

“用计算社会科学抢政治学者的饭碗”

在中国社科院做研究时,唐世平思忖,国内传统社科学界总是按资排辈,“资历越老的教授越有话语权,这说不通”。

唐世平的学术生涯深受现代计算机之父冯·诺依曼(Von Neumann)、诺贝尔经济学奖得主托马斯·谢林(Thomas Schelling)等学者的影响。他认为,许多复杂的决策问题应该需要技术支持。而类似于美国兰德智库等以技术主导的研究在中国的智库当时几乎不存在。

在唐世平眼中,战争、冲突和威慑等问题是一种“非常规复杂战略博弈”——这些博弈涉及多个行为体、多个行为和行为规则,行为交互作用更加多元,甚至要考虑到行为体多个方面的得失,因此权衡得失异常困难。

“因为没有技术支持,我们很多专家只是看看新闻、拍脑子做决策,他们的论断缺乏数据、实证和模型支持。”唐世平想要为登上世界舞台的中国做点改变。

2011年前后,他开始筹建复旦大学复杂分析决策中心。为了推演和预测“非常规复杂战略博弈”,唐世平认准了由博弈论发展而来的“基于行为体的模拟模型(Agent Based Modeling,简称ABM)”。

ABM是一种自下而上的行为体建模技术,用于模拟具有自主意识、特定特征的行为体(agent)的行为和相互作用。行为体可以是政党、政府、社会组织、个人等。其结果是复杂系统中众多行为体相互作用所产生的“涌现式结果(emergent outcomes)”。

“ABM的结果不是具体的某个数值,而是多次计算得出不同结果的概率分布。”唐世平曾解释,在构建ABM时,研究者一般会对行为体、行为、行为规则、互动规则、系统环境等先做设定,但这些设定通常都不是固定数值,而是某个区间,然后用蒙特卡罗模拟(记者注:一种用计算机生成大量随机数据来预测结果的算法,适用于处理不确定性问题)过程来随机抽取。

在经过多轮模拟之后,研究人员可以通过更改这些设定来创建数量巨大的相邻模型,然后基于验证(validation)和校准(calibration),ABM可以靠修改方程、参数调参来迅速筛选出更符合实际世界的模型。

最早,唐世平团队尝试用ABM建模来处理“非常规复杂战略博弈”,诸如“苏联撤军后谁来主导阿富汗”等。而迈入大选预测,其实纯属“机缘巧合”。

2015年元旦,他与一位台湾学者探讨政治学研究时发现,大部分选举研究都只是解释选举政治。“这多没意思啊!要不我做一个东西,干脆让他们都失业得了!”唐世平调侃,当时的玩笑也成了他这些年研究的动力。

此后,一发而不可收。唐世平与他的同事们开启了国内独树一帜的“基于计算机模拟的选举预测研究”。

模拟一场美国大选

“我们中心的美国选举团队核心成员有四五个人,美国部分由我的学生王凯主导,王中原老师也会参与一部分。主要的构想由高鸣和我们其他的数据工程师、软件工程师实现。我们中心的项目常常是我负责提供idea,由他们来具体实施。”唐世平作为复旦复杂决策研究中心的“老板”,为推动计算社会科学、全数据建设,不断给中心筹集资金、提供研究方向、招兵买马。

传统美国大选预测依赖民调、意见领袖分析,由于2016年特朗普和希拉里竞选期间,多家金牌民调翻车预测,外界基本对民调丧失了信心。作为技术弄潮儿的唐世平团队,是如何用ABM模拟美国大选的?

“首先是要收集数据,搭建选民行为体。”唐世平强调,他们搜集的数据全部是公开数据,共有五十多项,其中涵盖从微观的人口统计学指标、中观的选举周期结果,再到宏观的美国经济数据。

下一步构建行为体是ABM模拟的核心动作。在大选预测中,一个选民即为一个行为体。

“拿美国的密歇根州来打比方。假定密歇根州有1000万选民,我们根据性别、受教育程度、族群分布等身份标签,用计算机生成1000万个选民模型。”唐世平提到,考虑到计算机算力有限,他们按1:10的比例缩小计算数据,只构建100万个密歇根选民。“基于历史选举投票结果,我们通过简单的回归分析,得出不同特征选民的投票倾向,得到粗略的投票结果区间。”

筛选与验证是很关键的。研究人员起初是无法判断几千万到上亿个ABM选民模型中哪一个更精准的。但这不重要,通过计算机模拟选民的投票结果,再与2000年至2020年的大选历史投票结果相对比,筛选出误差最小的选民模型就可以。

在此期间,模型至少经过两轮以上的数据筛选,其中会加入选举周期、政治丑闻冲击、候选人特征等因素。最终剩下的模型和历史选举结果的误差仅在2.5%-3%之间。

“如果一个ABM选民模型能重复出历史上的五六次选举结果,一定不是奇迹。”唐世平说,最后,只会剩下几十到几百个最终符合标准的选民模型,再放入最新公开数据,预测2024年的选举结果。

在整个模型预测过程中,计算机的算力是技术保障。“2016年第一次预测时,我们学校的服务器跑得太慢了,只能去外面租阿里云计算的服务器。”唐世平解释,由于每个ABM模型是一个预测区间,每次计算会在区间里随机取一个数,也因此每一个ABM模型只有进行成百上千次的计算,才能得出一个相对稳定的结果。

“随着云计算水平的普及和提高,现在我只要买足够的服务器,半个月就可以算完所有大选预测数据。”唐世平说,2024年美国大选的预测结果是在9月底第二季度经济数据公布后,10月初就算完的。

最后,唐世平团队通过ABM模拟预测了2024年美国大选的八个关键州,他们的预测结果是特朗普赢得:密西根、俄亥俄、宾夕法尼亚、佛罗里达、威斯康星。哈里斯赢得:佐治亚、亚利桑那、北卡罗来纳。

“剩下42个州通过100万次的蒙特卡罗模拟,得到民调预测结果及选举人团票归属。两相汇总,再得出2024年美国大选整体预测结果。”唐世平说。

ABM模型预测大选的过程,Forecasting elections with agent-based modeling:Two live experiments论文截图。

没算准的摇摆州

熟悉美国大选的人不难看出端倪。在美联社最终公布的2024年大选结果中,特朗普横扫多个摇摆州,以312张选举人票当选第47任总统。尽管唐世平团队的总体结果正确,而且对五个摇摆州的预测也是正确的,但是他们对其它三个州(亚利桑那、佐治亚、北卡罗来纳)的预测却是错误的。

“任何预测都会有偏差。”对于摇摆州预测的失误与外界的质疑,唐世平回答时很坦然,“好在我们的ABM预测可以复盘,不像民调总有难以克服的问题”。

预测失误的佐治亚、亚利桑那、北卡罗来纳是他们团队2024年才开始做数据统计的三个州,无论是2018年的中期选举,还是2020年的大选都尚未涉及。

“在这三个州的数据搜集上,我们可能不够全面、精准。”唐世平想了想说,比如9月24日至27日,北卡罗来纳遭遇了飓风,之后拜登政府的赈灾不力。但我们的模型在10月初就已经算完,我们没法再将自然灾害对选民的影响纳入计算。

唐世平团队的大选预测结果会给出一个相对得票率区间。“最终结果如果与预测模型相差超过±2.5%的范围,就证明这一个模型建构不够完善。”他说,“虽然每次预测的技术是一样的,但ABM的建模是一个不断筛选的过程。”

用ABM预测大选远优于传统民调。唐世平提到,民调是很难判断特朗普遭枪击等“黑天鹅事件”对于预测结果的影响,因为没有一个“特朗普未遭枪击”的对照组作比较。“但是,基于ABM的技术则是可以的,因为冲击事件的最终影响是可以累加到基础模型给出的结果的。因此,通过比对最终的预测选举结果和实际的选举结果,可以大致估计这些冲击事件的最终影响。”

“大选期间的突发事件对最终的结果的影响肯定没有大众心理那么大。”唐世平和团队发现。

“当然,如果特朗普在大选最后一刻遭遇枪击,而我们的模型早就算完了,也是不能预测的。”

在他看来,重复性的、有特定指标的事情、稳定的国家政体走向等都是可以用ABM预测的,而多党竞争、战争的具体动态是难以预测的。“以战争为例,我们可以预测一个特定时间段内是否有战争爆发、如何爆发。但战争的走向却比较难以预测。”唐世平说。

当南方周末记者问到“人的行为是可被量化的吗”时,唐世平用另一种技术路径探索解释,“最近,魏忠钰老师的团队和我们一起,在尝试用大语言模型(LLM)判断选民的投票倾向,他原来是做自然语言处理的。”魏忠钰曾对美国国会议员的公开表态与其议案投票建模,去预测和解释政客是否言行一致。

“ABM是模拟100万个选民。而魏老师是用大语言模型解读选民的公开言论,基于AI来判断其投票倾向,再推断选民的支持方向。因此,这是两种非常不同的技术路径。”唐世平说,我们从来不假设每一个选民都是理性的,每一次模拟都是准确的。科学的好处就是“我们可以不断改进模型,不断进步”。

面对外界对用计算机模拟来预测大选的争议,唐世平毫不在意。他只觉得“自己又做出来一个有意思的研究”,这才是三十多年来不断改换赛道、突破新研究领域的他。

“现在做选举预测的学者,应该都要引用我们发在PLOS ONE上的英文论文。我们是第一批将ABM系统引入预测选举的学者。”唐世平很笃定,也有些骄傲地说。

参考资料:

1.唐世平.(2023).计算社会科学与科学决策的未来.《国际政治科学》,第8卷,第3期.

2.王中原,唐世平.(2020).政治科学预测方法研究——以选举预测为例.《政治学研究》,第2期.

3.Gao,M.,Wang,Z.,Wang,K.,Liu,C.,&Tang,S.(2022).Forecasting elections with agent-based modeling: Two live experiments.PLOS ONE,https://doi.org/10.1371/journal.pone.0270194.

南方周末记者 顾月冰

责编 姚忆江

来源:南方周末

相关推荐