摘要:许多人认为数学离我们很远,除了买菜根本用不着。但他们错了。在英国,280 万数学科学从业者一年就为经济贡献了 2080 亿英镑——也就是说,10% 的劳动力贡献了 16% 的经济产值。
许多人认为数学离我们很远,除了买菜根本用不着。但他们错了。在英国,280 万数学科学从业者一年就为经济贡献了 2080 亿英镑——也就是说,10% 的劳动力贡献了 16% 的经济产值。
为什么公众对数学的认识与现实之间存在如此巨大的鸿沟?伊恩·斯图尔特在《让鸽子开公交车?》中探讨了这个问题,并从政治、医疗、气候、出行、娱乐、信息安全、智能生活等多个角度切入,展示了在日常生活的背后,数学如何以令人惊讶的方式发挥着至关重要的作用。
经授权,我们节选了第二章《政客是如何收割选民的》分享给读者。
1812 年 3 月 26 日,《波士顿公报》(Boston Gazette)为全世界带来了一个新词:格里蝾螈(gerrymander)。起初,这个词的拼法是 Gerry-mander,是由两个标准词合成的,后来,刘易斯·卡罗尔将其定成合成词。“mander”是“salamander”(蝾螈)的后缀,而“Gerry”则是马萨诸塞州州长埃尔布里奇·格里的姓。我们无从考证是谁首先把它们拼在一起的,但考虑到当时的情况,历史学家倾向于认为是《波士顿公报》编辑内森·黑尔、本杰明·罗素或约翰·罗素中的一位。顺便说一句,“Gerry”的“G”为硬 G(发/g/音),和“Gary”发音一样;而“gerrymander”的“G”为软 G(发/dʒ/音),就像“Jerry”。
埃尔布里奇·格里干了什么,让他的名字和像蜥蜴一样的东西合体(在中世纪的民间传说里,人们认为这种生物住在火里)?
答案是:操纵选举。
更准确地说,格里负责了一项重新划分马萨诸塞州参议院选举地区边界的法案。只要有划分,自然会产生边界:长期以来,这种情况在大多数民主国家一直很普遍。公开是出于实用性的考量,如果每项提案都由整个国家投票表决,那么会很不方便。(瑞士比较接近这种情况:联邦委员会每年最多选取四次提案供公民投票,它们本质上是一系列全民公投。但另一方面,那里的妇女直到 1971 年才获得选举权,有一个州甚至一直坚持到 1991 年。)长期以来的解决方案是选民们选出人数少得多的代表,并让这些代表做决定。有一种比较公平的方法是比例代表制,即某一政党的代表人数与该政党获得的选票数量成比例。而更常见的做法是,人口被划分到选区,每个选区选举一定数量的代表,其数量大致与该地区的选举人数成比例。
例如,在美国总统选举中,每个州投票给特定数量的“选举人”——选举人团的成员。每个选举人有一票,谁成为总统是由这些选票的简单多数决定的。当时,将信息从美国腹地传递到权力中心的唯一方式是骑马或乘马车,这套系统是在那样的年代诞生的,而长途铁路和电报是后来才有的。当时,计算大量的个人选票过于缓慢,而这种制度也把控制权给了选举人团的精英们。在英国的议会选举中,国家被分成(主要是按地域划分的)不同选区,每个选区选举一名国会议员(Member of Parliament,缩写为 MP,在英国政体中专指下议院议员)。然后,拥有最多议员的政党(或联合政府中的政党)组建政府,并通过各种方法选出其中一名议员担任首相。首相拥有相当大的权力,在很多方面更像是一位总统。
将民主决策交由少数人把关还有一个隐蔽的原因,那就是投票更容易被操纵。所有这样的制度都有先天性缺陷,往往会导致奇怪的结果,有时还会被用来藐视人民的意愿。在最近的几次美国总统选举中,选民投给败选的候选人总票数要大于获胜的候选人票数。我同意,目前的总统选举方法并不是基于普选的,但有了现代通信后,它没有改变为一个更加公平的制度的唯一原因是有很多权力人士喜欢它现在运作的方式。
这里的根本问题在于“白白浪费的选票”。在每个州,候选人需要获得总票数的一半再加上一票(如果总票数是奇数,则需要再得到半张票)才能获胜;任何超过这个范围的额外选票对选举人团阶段的情况都没有影响。因此,在 2016 年总统大选中,唐纳德·特朗普和希拉里·克林顿分别获得了 304 张和 227 张选举人票,但克林顿比特朗普多了 287 万张普选票。特朗普由此成了第五位输掉普选的美国总统。
美国各州的边界实际上是不能动的,所以上面的情况并不是一个选区划分的问题。在其他选举中,选区边界可以被重新划定,并且通常由执政党执行,这样就会出现一个更隐蔽的缺陷。换句话说,该政党可以通过划定边界,以确保反对党的大量选票被浪费。就像埃尔布里奇·格里搞的参议院投票。当马萨诸塞州的选民看到选区地图时,大多数看起来完全正常,除了一个选区:该州西部和北部的 12 个县被合并成一个曲折蜿蜒的不规则区域。一位政治漫画家——可能是集画家、设计师和雕刻家于一身的埃尔卡纳·蒂斯代尔——很快就在《波士顿公报》上发表了一幅绘画,那块区域在画上就像是一只蝾螈。
格里是民主共和党人,该党的竞争对手是联邦党。在 1812 年的选举中,联邦党人赢得了众议院和州长职位,这使得格里被迫下野。然而,他对州参议院选区的重新划分却成功了,民主共和党轻松地拿下了该地区。
被独裁者统治的国家或者等同于独裁的国家,通常通过选举向世界证明它们是多么的民主。这些选举通常是被操纵的,即使允许法律质疑,这些质疑也不会成功,因为法院也是被操纵的。在别的国家,不仅可以对任何重新划分选区的具体案例提出质疑,而且有可能成功,因为法院的判决基本上独立于执政党。当然,这得排除法官的任命是基于党派的情况。
在这些案件里,法官面临的主要问题不是政治,而是找到客观的方法来评估是否发生了不公平的选区划分。对于每一个仔细打量了地图后宣称划分不公平的“专家”来说,你总能找到另一个持相反结论的人。我们需要比陈述观点和口头辩论更客观的方法。
这显然是数学大显身手的好时机。公式和算法可以在有明确定义的情况下,量化区域的边界以确定其是否公平合理,抑或是否故意为之和带有偏见。当然,设计这些公式和算法本身并不是一个客观的过程,然而一旦它们得到一致认可(这在一定程度上是一个政治过程),相关的每一个人都了解它们后,其结果是可以被独立验证的。这为法院的判决提供了逻辑基础。
明白了政客用来实现党派重新划分选区的秘密方法后,你就可以构造数学上的量或规则来发现它们了。任何规则都不完美——事实上,这已经被证明是不可能的,这一点等有了相关的背景知识后,我会再谈。目前可供使用的方法有五种:
● 检测选区是否奇形怪状。
● 检测席位与选票比例是否不平衡。
● 量化被检分区产生了多少被浪费的选票,并将其与经法律认定有效的选票进行比较。
● 考虑所有可能的选举分区地图,根据现有的选民数据估计可能的结果,并检查所提议的分区地图在统计上是否是一个异常值。
● 双方达成协议以保证最终结果本身是公平的,看起来是公平的,并且这种公平是得到认可的。
第五种方法是最令人惊讶的,而令人惊讶的地方在于它实际上是能被实现的。让我们顺次讨论,把这份惊喜留到最后。
首先,是检测奇形怪状。
早在 1787 年,詹姆斯·麦迪逊就在《联邦党人文集》(The Federalist Papers)中写道:“民主的自然极限是距离中心点的距离,它恰好让在最偏远的公民在他们有公共集会需求时聚集起来。”从字面上讲,他觉得选区应该大致呈圆形,并且不是太大以至于从外缘到中心的旅途时间变得不切实际。
例如,假设一个政党的主要支持者集中在沿海地区,把所有这些选民都集中在单个选区里,就会形成一个细长蜿蜒的形状,沿着海岸一路延伸——这与其他漂亮、紧凑、合理的选区相比,是完全不自然的。我们很难不得出这样的结论:某些滑稽的事情正在上演,这样划定的边界,只是为了确保该党的大量选票被浪费。格里蝾螈式选区往往因其怪异的形状而暴露出它的党派属性,就像最初由此得名的那个选区。
法律界可以无休止地争论何谓奇怪的形状。因此,律师丹尼尔·波尔斯比和罗伯特·波佩尔在 1991 年提出了一种对某个形状的奇怪程度进行量化的方法,它如今被人们称为“波尔斯比—波佩尔值”(Polsby–Popper)。其计算方法是:
4π × 面积 ÷ 周长的平方
任何对数学敏感的人都会立刻被 4π 这个因子所吸引。就像维格纳的朋友想知道人口规模和圆有什么关系一样,我们也可以试问圆和政治选区又有什么关系。它的答案简单而直接:圆是最紧凑的形状。
这个事实的历史很长。根据古希腊和古罗马的资料,特别是维吉尔的史诗《埃涅阿斯纪》(The Aeneid)和格涅乌斯·庞培·特罗古斯的《腓利比历史》(Philippic Histories),迦太基城邦的创立者是狄多女王。朱尼安努斯·查士丁在 3 世纪总结了特罗古斯的历史叙事,它讲述了一个引人瞩目的传奇故事。狄多和她的兄弟皮格马利翁是提尔城的某位不知名国王的共同继承人。国王死后,尽管皮格马利翁很年轻,人民还是希望他能独立统治。狄多嫁给了她的叔叔阿塞尔巴斯,传闻他有一笔秘密的财富,皮格马利翁想得到它们,于是谋杀了阿塞尔巴斯。狄多假装把所谓秘藏的金子扔进了海里,但实际上倒的是一袋袋沙子。由于害怕皮格马利翁震怒,她先是逃往塞浦路斯,后来又逃到了非洲北部海岸。她请求柏柏尔人的王伊阿耳巴斯赐予她一小块土地,好让她在那里休息一段时间。国王答应她,只要是牛皮能圈住的地都是她的。狄多把牛皮割成很薄的细条,用它做成一个圆,围住了附近的一座小山,时至今日,这座小山仍被称为比尔萨山(Byrsa),意思是“兽皮”。这块定居地就是后来的迦太基城,当迦太基变得富饶后,伊阿耳巴斯命令狄多必须嫁给他,否则城市将被夷为平地。她在一个巨大的火堆上献上许多祭品,假装是为了纪念她的第一任丈夫,为嫁给伊阿耳巴斯做准备。随后,她爬上火堆,宣誓要和第一任丈夫厮守,而不是屈服于伊阿耳巴斯的欲望,随即便用剑自杀了。
我们不知道狄多是否真的存在,尽管皮格马利翁确实是存在的,而且有些资料曾提到他和狄多。因此,探寻这个传说的历史准确性毫无意义。尽管如此,这个历史上的传说隐藏了一个数学秘密:狄多用牛皮做圆围住了一座山。为什么是圆呢?因为——如同数学家所宣称的——她知道在给定周长的情况下,圆所包围的面积最大。这一事实有一个令人印象深刻的名字,叫作“等周不等式”,古希腊人根据经验掌握了它,但直到 1879 年它才被严格证明,复分析专家卡尔·魏尔施特拉斯以此填补了几何学家雅各布·施泰纳发表的五个不同证明里的空白。施泰纳证明了如果存在一个最优的形状,那么它一定是圆,但他没能证明其存在性。
等周不等式指出:
周长的平方 ≥4π× 面积
它适用于平面上任何具有周长和面积的形状。此外,常数 4π 是最好的情况,它不能再大了,只有当形状是圆时,“大于或等于”才取等号。等周不等式使得波尔斯比和波佩尔提出了一个被我称为“波尔斯比—波佩尔值”(缩写为 PP)的量,它是衡量一个形状有多圆的有效方法。例如,以下形状的 PP 值分别是:
圆:PP 值=1
正方形:PP 值=0.78
等边三角形:PP 值=0.6
格里蝾螈的 PP 值约等于 0.25。
不过,PP 值有严重的缺陷。考虑到当地的地理环境,如河流、湖泊、森林和海岸线的形状,产生奇怪的形状有时不可避免。此外,某个选区可以是整齐、紧凑的,但显然被划分得不公平。2011 年宾夕法尼亚州立法机构投票表决的选区划分方案就是看上去被人为地划分得非常扭曲,所以 2018 年州立法机构的共和党人起草了将其取代的提案。根据该州最高法院规定的五项指标,这些选区被视为高度紧凑的,但对这些地区选民分布的数学分析表明,选区边界具有很强的党派色彩,这会使投票结果产生偏差。
甚至制图比例也会造成问题。这里的主要问题是分形几何,分形是一种在所有尺度上都具有详细结构的几何形状。许多自然形状看起来像分形——至少它们看起来比欧几里得的三角形和圆更像分形。海岸线和云层可以被非常有效地按分形来建模,它充分体现了它们复杂的结构。“分形”这个词是由伯努瓦·曼德尔布罗在 1975 年创造的,他是整个分形几何学领域的先驱和推广者。海岸线和河流是曲折的分形曲线,你量出的长度取决于使用的刻度有多精确。事实上,分形曲线的长度从技术上看是无限的,把它翻译成我们的日常用语就是“随着观察越来越仔细,测量出来的长度会无限增长”。因此,律师可以无休止地就周长的测量进行争论,更不用说该地区是否划分得不公平的争论了。
另一种检测选区划分是否公平的方法是,比较其他(选区)划分的方式在可能的投票样例下整个地区的选举结果。这一想法的主要问题在于,即使只是考虑现实中选区和小块土地的数量规模,也不可能穷尽所有情况。这是组合爆炸,它的数值将以极快的速度增长。此外,所有的选区地图都必须合法,这个约束条件在数学上难以处理。
幸好,数学家在很久以前就找到了一种规避此类组合爆炸的方法,它就是马尔可夫链蒙特卡罗方法(Markov Chain Monte Carlo,缩写为 MCMC)。相较于调查每幅地图,MCMC 构造了一个地图的随机样本,使其大到足以得到准确的估计。它类似于民意调查通过询问相对较少的随机样本来估计选民的倾向。
蒙特卡罗方法可以追溯到战时制造原子弹的曼哈顿计划。当时,一位名叫斯坦尼斯拉夫·乌拉姆的数学家正在生病静养。他通过玩需要耐心的游戏消磨时间。他想知道自己获胜的概率有多少,于是试着估计一副牌会有多少种可以实现完美通关的牌序,很快他就意识到这种方法行不通。于是他改为自己玩很多局,并计算其中获胜的局数。随后他发现,类似的方法可以用来求解曼哈顿计划所需的一些物理方程。
以俄国数学家安德烈·马尔可夫的名字命名的马尔可夫链,是随机(或醉汉)漫步的一般化理论。有些衣衫褴褛的人在路面上摇摇晃晃、随意地向前或向后走。平均而言,在给定步数的情况下,他们会走多远呢?(答案是:平均来说,大约是步数的平方根。)马尔可夫设想了一个类似的过程,但路面被一个网络所代替,沿着网络边缘的移动都标有特定的概率值。这里的关键问题是:在漫游了很长一段时间后,停在任意一个特定节点的概率是多少?马尔可夫链模拟了许多现实世界的问题,在这些问题中,一连串事件发生的概率都是由当前的情况决定的。
MCMC 就是把这两种方法整合在一起:用蒙特卡罗方法对所需的概率进行抽样。2009 年,统计学家佩尔西·迪亚科尼斯估计,在科学、工程和商业领域的统计分析中,约有 15% 是由 MCMC 驱动的,因此,在判断选区是否公平时,尝试这种强大、成熟、有用的方法是合理的。用马尔可夫链模仿随机漫步的方式生成选区地图,并用蒙特卡罗方法对其进行抽样,就能得到一个非常棒的统计方法,用以评估一个选区划分提案是否具有代表性。还有一种更复杂的数学方法可以证实这些方法,那就是遍历理论,它能保证足够长的随机漫步抽样能得到准确的统计数据。
近来,数学家已经在法庭上为 MCMC 做证。在北卡罗来纳州,乔纳森·马丁利用 MCMC 的估计值同一些数值的合理范围做了比较,比如对某党赢得的席位数而言,如果采用的选区划分在统计上是一个极端的异常值,那么表明这种划分是有党派色彩的。在宾夕法尼亚州,韦斯利·佩格登用统计学方法,计算了政治中立计划的结果比随机漫步计划的结果还要糟糕的可能性有多小,并估算了这种结果纯属偶然的可能性。在这两个案例里,法官认为数学证据是可信的。
对不公平划分选区的数学理解有利有弊。它可以帮助选民和法院发现这种情况,但也可以提出更有效的不公平选区划分方案。它可以帮助人们遵守法律,但也可以帮助他们突破法律,或是更糟的——扭曲法律。每当为防止某种滥用而制定技术性规则时,人们就会钻制度的空子,仔细推敲这些规则是否有漏洞。数学方法的最大优点是能让规则本身变得清晰,它还会带来一种全新的可能性。与其徒劳地想要说服彼此竞争的政治利益集团就什么是公平达成一致,好让他们有机会玩弄受法院监管的体制,倒不如让他们自己一争高下。这不是让他们仗着自己所拥有的权势和金钱资源自由混战,而是得在一个确保结果本身是公平的、看起来是公平的,而且各方无法拒绝接受它是在公平的框架里运转。
这似乎包括了很多问题,不过专门用于这个思路的完整数学领域最近已经出现了,那就是公平分配理论。它让我们明白,精心构建的谈判框架可以实现原本看似不可能的目标。
最经典的例子莫过于两个孩子为了分一块蛋糕而争吵。如何使用一种可以被证明是公平的协议(一套预先明确的规则)分配蛋糕呢?比较经典的解决方案是“我切,你选”。让艾丽斯切蛋糕,那么她就会认为两块蛋糕是一样的。然后让鲍勃先选一块,由于蛋糕是他自己选的,那么他就不该有任何异议——他有机会选择另一块。艾丽斯也不应该有异议:如果她认为鲍勃选了更大的蛋糕,那么她一开始就应该把它们切得不一样。如果他们为不知道选谁切蛋糕而烦恼,那就抛硬币决定,但这其实无所谓。
人的本性就是这样,我们不能确定孩子们在分完蛋糕后也是如此。以前,我曾在一篇文章中说过这个方法,有一位读者写信给我说,他在自己的孩子身上用了这个方法,结果他家的“艾丽斯”立即抱怨说“鲍勃”的那块更大。当这位读者指出这是她自己切得不好时,这句话并没有起什么作用——在“艾丽斯”看来,这相当于在责备吃亏的人——所以她父亲把那两块换了一下,结果只是听见女儿哀号道:“他的那块还是比我的大!”但这类协议应该会让政客满意,至少能让他们闭嘴,当然它也应该在法庭上得到采纳,法官只需要检查一下程序执行得是否正确。
此类协议的主要特征是,我们不是去想着消除艾丽斯和鲍勃之间的相互敌对,而是利用这种敌意来实现一个公平的结果。不要要求他们公平竞争,不要要求他们相互合作,更不要人为地给“公平”下一些法律上的定义,让他们互相对抗,正大光明地行事就行。当然,艾丽斯和鲍勃必须事先同意遵守这些规则,必须就某些事情达成一致,这些规则显然是公平的,倘若不遵守,很可能会遭到冷遇。
“我切,你选”有一个很重要的特点,它不涉及对蛋糕客观价值的评估,而涉及玩家自身对其价值的主观估计。他们只需要用自己的标准去衡量分配是否公平,也就是说,他们不需要就任何东西的价值达成一致。事实上,如果不需要对事物的价值有一致的看法,公平分配会更容易一些。一个想要樱桃,另一个想要糖粉,谁都无所谓对方的—分配完毕。
当数学家和社会科学家开始认真考虑这类问题时,发现了其中不为人知的重大难点。首先他们想到的是三个人应该如何分配蛋糕。不仅很难轻而易举地找到最简单的方法,而且结果出人意料。艾丽斯、鲍勃和查理都认为结果是公平的,根据自己的计算,他们至少得到了三分之一的蛋糕,但艾丽斯或许仍会嫉妒鲍勃,因为她认为他的份额比自己的大。在艾丽斯看来,查理的份额必须比她的小,才能得到补偿,这并不矛盾,因为鲍勃和查理对自己手里的那份蛋糕的价值有不同的想法。因此,寻求一个不仅公平而且不会产生嫉妒的协议是说得通的。事实上,这也是可以实现的。
20 世纪 90 年代,从史蒂文·布拉姆斯和艾伦·泰勒发现四人无嫉妒分配协议开始,人们对公平且无嫉妒分配的理解取得了重大进展。当然,蛋糕只是用来比喻可分配的有价物品。该理论研究的是可以按照人们的意愿任意划分的物品(如蛋糕),也可以是按块分割的物品(书籍或珠宝)。这使得它适用于现实世界中的公平分配问题,布拉姆斯和泰勒解释了如何使用这种方法来处理离婚纠纷。他们的“调整赢家”协议有三个主要优点:它是公平的、无嫉妒的以及有效的(即帕累托最优)。也就是说,每一方都会觉得自己的份额至少和平均份额一样大,他们不想和其他人交换,也不存在其他的对每个人而言都一样好或对某些人更有利的分配方法。
比如,在离婚谈判中,它的运作方式大致如下。在合作了一辈子加密信息交互后,艾丽斯和鲍勃厌倦了彼此并决定离婚。他们每个人都有 100 点积分,用于为每件物品(房子、电视、猫)赋予一定的分值。初始化时,物品会被分给使它积分最高的人。这是个有效的做法,不过这种做法通常既不公平也会惹来嫉妒,所以协议进入下一个环节。如果两个人得到的(物品的)积分总和相同,那么双方都能很满意地完成分配。但如果得分不同,此时不妨假设根据两人到手的物品计算,艾丽斯的得分比鲍勃的高,那么为了确保两人得分变得相同,物品就会按某种顺序从艾丽斯(赢家)转给鲍勃(输家)。因为物品及其估值是离散的,所以可能会对某些物品本身再做分配,但整个协议使得这种物品最多只有一件,它极有可能是房子,那么就得把它卖了分钱;但如果是鲍勃买的还未上市的苹果公司的股票,那么就可能不是把它卖了分钱了。
“调整赢家”满足公平分配的三个重要条件。首先,它可以确保这个协议是公平的:它被证明是公平的、无嫉妒的且有效的。其次,它通过多边评估发挥作用:个人的偏好被考虑在内,他们所得之物的价值由自己评估计算。最后,它在程序上也是公平的:无论最终达成的方案是什么样的,双方都能理解并验证其公平性保证,如果有必要,法院也可以判决它是公平的。
如今,关于选举的数学是一个非常广博的主题,而不公平划分选区只是其中的一个方面。人们在不同的投票制度上做了大量的工作,这些投票制度包括简单多数票当选、单一可转移票制、比例代表制,等等。此类研究中出现的一个普遍主题是,在任何真正的民主制度中,如果你要求选举具备某些你所希望的特征,其结果是,在某些情况下这些要求会相互矛盾。
所有这些结论的“祖母”是阿罗的不可能定理。经济学家肯尼斯·阿罗于 1950 年发表这个定理,并于一年后在他的《社会选择与个人价值》(Social Choice and Individual Values)一书中做了解释。阿罗研究了一个分级投票系统,在这个系统中,每位选民为选票上列出的选项进行打分:1 分表示最喜欢的,2 分表示次之,以此类推。针对这样的投票系统,他提出了公平性的三个标准:
● 如果每个选民都倾向于喜欢其中的一个选项,那么整个群体也是如此。
● 如果选民在两个特定选项之间没有什么偏好,那么这个群体对此也没有偏好,即便其他选项的偏好发生了改变。
● 独裁者不可能永远决定群体的选择。
这一切都让人很满意,但正如阿罗所证明的那样,它们在逻辑上是矛盾的。这并不意味着这样的系统一定是不公平的:只是在某些情况下,结果是违反直觉的。
不公平划分选区也有属于它自己的阿罗定理推论。其中一条是由鲍里斯·阿莱克谢耶夫和达斯廷·米克森在 2018 年发表的,它规定了公平划分选区的三个原则:
● 每人一票:每个选区的选民人数大致相同。
● 波尔斯比—波佩尔紧凑:所有选区的波尔斯比—波佩尔值数都大于法律规定值。
● 有限的效用差距:这一条技术性更强,粗略地说,如果任意两个选区的选民数量和全部选区的总选民数量之比不超过某个固定值,那么效用差距小于 50%。
然后,他们证明了不存在总能满足这三个标准的分区系统。
民主永远不可能是完美的。事实上,考虑到其目的是说服数以百万计的人——而他们中的每一个人都有自己的观点——就某些会影响到他们自己的重要之事达成一致,它的效果是惊人的。独裁就简单多了:一个人,一票。
来源:好奇心精选一点号