【香樟推文3687】被打断的声音?经济学研讨会中的性别差异

B站影视 韩国电影 2025-11-01 19:42 1

摘要:经济学研讨会具有独特的互动性文化——有些人甚至认为是具有攻击性,是思想碰撞最频繁的场合。然而,一个没有得到充分关注的问题是:这种文化真的对所有学者一视同仁吗?具体来说,经济学研讨会中是否存在可度量的性别差异?这种差异是如何在交流行为中体现出来的?本文收集了数千

01 引言

经济学研讨会具有独特的互动性文化——有些人甚至认为是具有攻击性,是思想碰撞最频繁的场合。然而,一个没有得到充分关注的问题是:这种文化真的对所有学者一视同仁吗?具体来说,经济学研讨会中是否存在可度量的性别差异?这种差异是如何在交流行为中体现出来的?本文收集了数千场研讨会、工作坊、会议和求职演讲的数据,对该问题进行了回答。样本涵盖了学术演讲的全部典型场景——从系内seminar到国际会议,从博士求职到线上学术社区,通过现场记录和录音数据对报告人与观众之间的每次互动都进行了编码。

研究发现,女性被问到的问题更多,且更可能受到傲慢或敌意对待。此外,本文还发现女性报告人的研讨会观众往往更多,尤其是女性观众更多——这暗示着潜在的榜样效应。这表明女性报告人能够激发更多的兴趣和参与度,这对报告人本人以及其他女性经济学者可能都是一种益处。

本文拓展了一支发展中的文献,该支文献记录了与相似条件下的男性相比,女性学者在许多方面受到较差的对待(如更多、更激烈的打断),这一现象不仅仅存在于经济学科中。已有研究表明,女性经济学家往往因为审稿、发表、引用等方面的系统性歧视,导致女性经济学家更难得到晋升。然而,已有研究缺少对学术研讨会的系统分析,而学术研讨会往往是名誉形成的场所,进而对学者的学术生涯发展产生影响。

02 数据

本文汇集了三组独立的数据收集工作,各组均面对着不同的后勤、法律和伦理约束。数据主要分成两类,首先是通过与“研讨会动态团体”(Seminar Dynamics Collective)合作,通过人工编码活动数据;其次是疫情期间的线上公开讲座,通过收集其音频并依赖机器学习算法进行编码。最后,共有五个场景,前三个场景由人工进行编码,后两个场景主要使用机器学习方法:

1. 学术就业市场。包括(但不限于)“前三十名”的经济学系。最终的样本包括176场就业市场演讲,涉及26所大学的80名求职者(其中31名女性,49名男性)。由人工进行编码。

2. 常规部门研讨会。收集了来自25所大学、46个研讨会系列的245场报告的数据,涉及220名独特的外部讲者(64名女性和156名男性)。由人工进行编码。

3. 2019年NBER夏季报告。包括443次报告,涉及当年举行的51个 NBER 项目会议中的48个会议。

4. 在线讲座。收集了疫情开始后、由美国或欧洲的经济系或备受认可的研究机构(如AEA或CEPR)组织或赞助的线上讲座。收集过程中排除了混合形式的讲座、由主持人汇总问题的讲座、设有讨论专家的讲座,以及非标准时长的讲座(少于20分钟或超过 110 分钟)。最终获得了994场讲座的样本,涵盖 86 个不同的在线系列。

5. 2022年NBER夏季报告。共包含467篇论文演讲,最后包括验证听众音频质量足够高的257个演讲的子样本。

总结下来,每个样本中由女性主持的讲座比例从28%到49%不等,拥有足够的波动去分析研究问题。而除了编码方式的差异(人工与机器)外,样本还涵盖了演讲类型(研讨会或会议)、形式(线下、线上或混合)、职业风险(如求职市场)和2022年NBER施加的数据收集限制四类差异,导致可构建的控制变量存在区别。

在人工编码部分,由招募人员在对应时刻按下记录器。记录器同时记录了按下的时间,记录内容包括打断的具体时间与持续时长;听众性别与学术身份(教授、博士生等);发言类型(澄清、质疑、评论、建议);情绪基调(支持、居高临下、敌意、破坏性)。通过交叉样本验证发现,不同观察员之间对同场seminar的打断计数相关系数高达0.86,说明数据记录具有良好的可重复性。此外,经过验证,招募人员的性别、对性别问题的关注度、性别思想倾向等均不影响编码结果。

本文使用深度学习方法编码音频。通过该方法可以识别出说话人的性别、是否为汇报人、音量、音高、音色等诸多特征。具体而言,包括使用Speaker Diarization算法识别发言者切换;通过深度神经网络(DNN)判断性别;利用情感语音识别模型(Emotion Recognition Model)将语气分类为积极、中性、消极;结合GPT-4o模型识别论文类型与研究主题(如理论还是实证)。该方法不仅扩大了样本规模,也减少了人工主观判断的偏差,比如DNN模型在性别识别任务中的准确率达到95%以上,语气分类准确率在83%–91%之间。

03 分析框架

本文讨论与处境相似的男性相比,女性汇报人是否(以及如何)被不同对待。主要结果包括打断的次数、类型和语气,以及谁打断了以及如何打断,估计如下形式的模型:

其中 p 代表具体的报告人, s 代表研讨会系列(如斯坦福发展经济学研讨会), r 代表展示的研究论文, c 代表编码方式(人工或机器)。 Female_Presenter 指示报告人是否为女性。

在估计时,本文仅比较处境相似的男性和女性。“处境相似”指的是在级别相当、来自类似排名机构的男性和女性,在同一系列研讨会中对相似主题进行演讲,故模型还引入了多个固定效应(如固定研讨会系列,这同时固定了领域(例如劳动)、地点(例如哈佛)、适用于特定研讨会系列的规则和规范、主办机构的声望以及该研讨会典型听众的特征)。在条件允许时,本文也控制了报告人的特征,如职称、谷歌学术引用次数、是否在学术机构工作、工作地点的地理位置(美国、欧洲或其他地区)、以及其所在部门的排名等;此外,还有论文特征,如JEL代码、是否包含经济理论、数据分析、实验设计和/或政策分析。值得注意的是,听众人数与性别构成可能受到讲者性别影响,故不引入作为控制。

04 实证结果

1. 打断的数量

表2中可以看到,相比于相似情况的男性,女性被打断的次数高出约10%。对于NBER的样本存在不一样的结论,但对于2019年的样本,不能排除其百分比效应与研讨会样本中的差异一样大的可能性;对于2022年的样本,由于是线上演讲且本文工作论文于2021年发布、于2022年汇报,人们对此问题有所关注,并清楚自己的行为正在被研究。该估计结果对于各类固定效应较为稳健,事实上,只要控制了研讨会系列固定效应,结果就是稳健的。

2. 出席情况与打断者特征

表3研究了报告人性别如何影响研讨会参与者的数量和组成。在人工编码样本中,按性别统计了参与者人数,并标注研讨会是否出席异常高;在在线演讲样本中,由于无法获取虚拟观众的信息,通过统计不同参与发言者的人数来替代衡量参与度。此外,没有2022年NBER的出席信息。研究发现,女性汇报人的研讨会参与者较多(尤其是求职讲座),且女性参与者的增加通常大于男性参与者的增加(按百分比计算)。这一点在女性汇报人的求职讲座中尤为突出。

表4进一步讨论了女性汇报人收到打断的来源。发现相比于类似情况下的男性,女性更易受到男性参与者的打断,这一点在在线讲座的样本中同样成立,说明参与规模并非是唯一的解释。此外,可以发现女性参与者在女性进行汇报时,出现了更多的打断。说明女性汇报人可以1)吸引更多的参与者,尤其是女性参与者;2)产生更多来自女性参与者的打断。这种情况表明某些差异性对待的动态影响可能对女性在专业领域中的代表性有积极作用。

3. 中断的语气、调性、类型及时机

表5展示了对打断行为的性质和语气的分析,并按报告人性别进行了分类。在人工编码的样本中,被归类为消极的打断包括“居高临下”“扰乱”“贬低”或“敌意”等标签,而积极打断则被编码为“支持”、“建设性”“合作性”或“有价值”,衡量标准基于招募人员对观众打断时说的内容评估。对于机器编码的数据,消极语气指的是听起来“消极-攻击性”(反映“愤怒”或“厌恶”等情绪)和“消极-被动性”(反映“悲伤”或“恐惧”)的打断,而积极打断则被归类为“高兴”或“正面惊讶”。

结果说明,相比与相似情况的男性,女性汇报人面对的负面打断数量更多。平均而已,女性汇报人收到额外额外0.5次被经济学同行评为负面语气的打断,以及额外0.9次被机器评为负面语调的打断。同时,正面语气的打断在人工样本中不存在性别差异,在机器编码样本中,正面语调的打断有所增加,这完全是由在线讲座的大样本导致。在该样本中,正面和负面打断的影响程度相似,与其他样本有所不同。

4. 中断的类型

在演讲过程中,打断可能以多种形式出现,包括提问、建议、批评和评论,并且会以不同的方式影响研讨会。在人工编码的样本中,中断被标注为评论、澄清、建议、批评、跟进或其他;对于机器编码样本则通过处理音频文本来识别中断,并通过是否存在问号划分为疑问类和陈述类。表6说明,女性汇报人收到更多的建议,这一点在人工和机器编码的样本中均存在。此外,对各类打断占比的分析显示,在任何结果中性别差异均不显著,这意味着女性只是以相同比例接收到更多的各类打断。

5. 中断的时机

图4使用线上样本,讨论被打断的时机,即是否会在说到一半时被打断。结果发现与处境相似的男性相比,女性汇报人在每场研讨会上会多被打断1.2次,而且所有额外的句中打断都是由男性观众造成的。与表4结果相比,在本样本中男性参与者打断次数的性别差异为1.6。这意味着男性对女性报告人的额外打断中有75%是在句中打断。对比而言,男性汇报人的所有打断中仅有54%是句中打断。

05 总结

通过分析2019年至2023年间约2000场经济学演讲的数据,本文发现女性汇报者被打断的次数比男性报告人高大约11%,该结果控制了领域、形式、时长和研讨会系列等因素。该现象主要有两个原因,1)女性汇报人有更多的听众,尤其是女听众,因此收到更多来自女性的打断,但与此同时,超过一半的额外打断来自男性。2)可以总结为听众对报告人性别的反应,导致相同规模的讨论会中,听众更频繁地打断女性报告人。此外,女性汇报人也收到了不成比例高的负面打断,且常常在讲到一半时被打断。

本文还发现女性报告人拥有更多女性听众,而且女性也更频繁地打断女性报告人。这一模式暗示了潜在的榜样作用——类似于女性常常承担对年幼女性同事的额外指导责任。女性报告人的出现可能营造出一个环境,使女性参与者在经济学研讨会中更愿意参与学术讨论。

本文的发现很可能并未反映研讨会参与者有意对男性和女性采取不同待遇,而是指出了潜在的隐性偏见。但是这类偏见可能不仅存在于研讨会互动中,还可能影响女性经济学家的职业发展。提高对自身偏见的认识并采取措施加以减轻,可以为建立一个更友好的学术讨论环境打下基础。

来源:数智行者

相关推荐