摘要:原文信息:Chen Y. Does the gig economy discriminate against women? Evidence from physicians in China[J]. Journal of Development Economi
图片来源:电影《黑客帝国》(GPT生成)
原文信息:Chen Y. Does the gig economy discriminate against women? Evidence from physicians in China[J]. Journal of Development Economics, 2024, 169: 103275.
01 前言
算法浪潮正在席卷各行各业,不同于传统的生产环节,数据作为一种新的生产要素,具有更加丰富的外部性值得研究。正如 Daron 在《THE SIMPLE MACROECONOMICS OF AI》 中提到的一样,AI 带来的虚假信息可能对宏观经济造成损害。从这一点上看,Ai、算法都在对数据进行“再生产”的工作,甚至是错误信息的反复加工——而我们依旧对数据生产函数的“再生产”知之胜少。日复一日的算法负反馈就发生在我们身边,值得进一步去挖掘!
本期推文将介绍JDE 上发表的一项研究《Does the gig economy discriminate against women? Evidence from physicians in China》。文章通过国内在线医疗平台的数据分析算法歧视的形成过程。
背景与引言
02
在线平台将工人与短期(临时)任务需求的雇主进行匹配。由于零工经济在工作方面具有灵活的时间约束,以往研究认为零工经济有助于缩小性别薪酬差距。当零工经济中的平台算法成为管理者的角色时,其输入数据受到社会偏见的影响,平台算法系统可能加剧性别不平等,因此,了解在线市场中的性别差距至关重要。
持有执照的医生可以在线上咨询平台注册服务,并决定工作时间和价格。春雨医生(后文简称为SDR)是国内最早成立的平台之一,也是下载最多的远程咨询应用程序之一。患者基于医生医院隶属关系、职称、价格、教育经历、照片等医生自愿提供的信息选择服务。春雨医生排名算法考虑了四个关键特征:专业头衔、医院隶属关系、服务意愿以及提供的咨询次数。
数据
03
文章从 SDR 网站和微信小程序收集了 2020 年 3 月 26 日至 6 月 30 日、 2023 年 2 月至 4 月两轮医生信息,最终得到13472 名医生的有效数据。
教育水平:未知学位、本科及其以下、硕博
职称:初级(普通医生)、高级(包括主治医生、副主任医生和主任医生)
工作经验:未知年份、少于10年、超过10年
医院等级:三甲(3a)到一丙(1c),从高到低九个等级
可用时间:医生在 2020 年价格数据中出现的次数。文章将其标准化为医生在 2020 年数据的 24 个实例中出现的次数
平均价格:2020 年 3 月至 6 月列出的价格总和除以 2020 年数据中可用时间的数量
平均月度咨询:样本期间首例咨询和最后一例咨询的月份间隔数
过去提供咨询数:患者可以观察到的医生提供咨询问答的累计量
患者\同行评分:患者平均打分、病例科目类型内标准化的评分
医生平均排名:平台医生平均排名
性别:基于照片和姓名进行预测
描述性统计结果表明,与男医生相比,女医生平均受教育程度相对较低,更有可能获得初级职称。三甲医院工作的女医生比例较小。女医生比男医生更不可能提供相关信息。女医生的平均显示排名高于男医生(女医生更不容易被患者看到)。
04 实证策略
Y为医生提供的价格和咨询次数;J为医生个体、s为病例类型、p为省份、t为加入平台的时间;G为性别变量(女为1,男性为0);控制变量为描述统计中的相关变量,固定效应包含病例科目类型、省份、进入年份。
女医生是否通过低价获取更多咨询?表 2 结果说明,与男医生相比,女医生收取的平均价格更低,每月提供的平均咨询量更多。但控制同一病例科目类型后,女医生平均费用更低,咨询次数也更少。
表 3 进一步控制与平台设计相关的两个变量:医生是否拥有个人照片,以及医生是否在医生名单前 50 名中。结果差距变化不大。
如果医生素质存在未观察到的性别差异,或者如果患者具有足够的经验来做出这种推断,那么观察到的性别差距可能会受到忽略变量偏差的影响。因此,文章使用晋升数据检验未来会得到晋升的医生群体情况。通过未来进入更高等级的医院或者获得更高职称的医生信息识别质量。表 3 第 3 列结果表明,在控制晋升变量后,女医生仍然比男性同行设定更低的价格,并提供更少的咨询服务。
05 平台的作用
表 4 对差距进行了 Gelbach 分解。结果表明平台设计对原始性别数量差距贡献了 23.43%。医生的照片特征和其在医生名单上的位置分别占性别差距解释部分的 5.65% 和 56.60%。这两个因素的综合影响超过了医生其他特征的贡献。
如果患者有意识地基于照片产生性别歧视,算法将会基于以往数据和平台利润最大化的动机会放大统计歧视。文章分别使用医生平均排名作为因变量,性别作为子变量。样本分为早已加入春雨医生的样本和刚加入一周的医生样本——新医生样本并没有患者咨询的先验信息。表5发现新医生排名性别差异并不显著。一定程度上验证了算法基于患者选择放大了歧视。
06 机制检验
文章使用2020年和2023年医生的平均排名进行相关性分析,说明了排名的粘性效应,这种效应意味着算法学习会持续放大不良反馈。
其他可能的机制:
文章进一步排除了三种限制:
(1)由于家庭责任而导致女医生供应减少:女医生的可用时间不低于男性医生。
(2)由于质量较低而导致女医生定价降低:女医生的同行相对评分不低于男性医生。
(3)由于自信心下降而导致女医生定价降低:区分医生照片为自拍照(赋值为1)或者证件照(赋值为0),女医生更偏好使用自拍照。使用照片类型变量和性别交互,机制效应并不显著。
07 稳健性检验和外部有效性
(1)分别使用Ngender和Namsor对姓名的性别进行预测。
(2)分别使用2020年提供照片的子样本和2023年更换了照片的子样本。
(3)安慰剂检验:使用偏中性的姓名样本进行检验,性别差异系数较小且不显著。
(4)使用微医平台的爬虫样本进行检验,结果类似。
08 总结
日星月异的算法究竟是让更多人被看见,还是让更多人被囚禁?
文章基于线上医疗平台的数据进行分析,揭示了医疗平台算法放大性别歧视的现象。歧视并非来源于算法本身,而是对消费者统计歧视的再生产。文章通过“医生数据特征-医生排名-医生性别薪酬差异”的分析框架构建了算法再生产的反馈路径。文章对歧视来源的分解过程破而后立,娓娓道来,值得我们学习其叙事技巧。文章对算法作用的动态视角也值得深入思考。如今,平台经济、双边市场让数据有了新的维度——消费者和生产者间的分配关系,而这种分配关系也能成为我们设计巧妙实证策略的新着力点。
来源:古畔听史