ChatGPT,取代工作or生产力神器?清华校友联手发文

B站影视 2025-01-12 16:05 2

摘要:自2022年11月30日发布以来,ChatGPT的月活跃用户数量已经达到大约1亿人,创造了最快增长的消费类应用纪录。

自2022年11月30日发布以来,ChatGPT的月活跃用户数量已经达到大约1亿人,创造了最快增长的消费类应用纪录。

虽然AI极大地提高了人们的工作效率。 但随着对不同领域的渗透,促使人们重新审视「技术取代」的问题。 最新研究则揭示了「拐点」的存在: 一旦 AI 取代效应占主导地位,它将无法逆转。 具体而言,作者在理论上,提出了AI进步对自由职业者影响的「 拐点 」:在AI能力超越拐点 之前 ,自由职业者始终从AI的进步中 受益 ;但在AI能力跨越拐点 之后 ,随着AI的进步,自由职业者都会变得更加 不利

左右滑动查看

以往的企业高管或AI专家, 更多在理论上,预测AI的智能水平可以取代人类从事哪些工作。 这次研究不仅提出了一般就业市场的「 拐点猜想 」,而且还用 数据证明 了:在不同的在线劳动力市场(online labor markets,OLMs)中, 写作、咨询、编程相关岗位更多体现的是取代效应,运营、创意更多体现的生产力效应 。前者表现为工作机会和收入将逐渐减少,而后者却完全相反。 研究的主要亮点如下: 对在线劳动平台,翻译和网页开发的实证研究,证实了AI的 取代效应和生产力效应 。 利用Cournot竞争模型,在适当假设下得到了「 拐点猜想 」:随着AI能力的不断提升,岗位数量和报酬水平会先 升高 (也就是生产力效应);但一旦超过某个阈值后,岗位数量和报酬水平会 不可逆转的下滑 (也就是替代效应)。

根据「拐点猜想」,分析了在线劳动平台上其他岗位,再次证明了 AI的能力一旦超过拐点,则会出现不可逆转的替代效应

结果表明在 写作、咨询、编程、运营和创意 等相关岗位,AI的 取代效应依次减弱

该研究发表在2025年第58届夏威夷系统科学年会上,作者来自新加坡国立大学、罗切斯特大学和清华大学。值得一提的是,他们全都是清华校友。

论文地址:https://scholarspace.manoa.hawaii.edu/server/api/core/bitstreams/4f39375d-59c2-4c4a -b394-f3eed7858c80/content

争议焦点

这一争议的核心在于:信息技术(IT)能够将许多 任务自动化 ,从而 提升 人类劳动的 生产力 ,但也可能导致劳动力被技术所 取代

这两种对立的效应称为 取代效应 生产力效应 这两股相反的力量相互竞争,共同决定技术如何最终影响劳动力市场。 在以往的相关文献中,技术本身通常被当作黑箱处理,作为生产函数中的一个因素与人类劳动一起作用于经济。然而,这种宏观视角的做法忽视了具体技术的影响,侧重于任意自动化技术的长期效果。 然而,考虑到当前AI技术的飞速发展,了解AI对劳动市场的影响显得尤为重要,尤其是对 在线劳动市场(OLM) 的影响。 与较为稳定的全职工作不同,自由职业工作更加容易受到市场变化的影响。 作者预计, AI 创新对工作市场的影响将首先在自由职业市场上显现。

主要内容

文章直接回答了一个问题: 为什么相同的 AI 创新,在不同类型的工作中会产生完全相反的效果?

为了解决这一问题,作者收集了跨多个职业的个人级数据,并提出了「拐点假设」来解释实证发现,从而为未来的实证研究和理论分析提供了新的视角。

具体而言,作者从颇受欢迎的在线劳动平台收集了数据。通过采用双重差分(Difference-in-Difference, DiD)设计,发现在线劳动力市场中自由职业者受ChatGPT的影响,呈现两种不同情况: 1) 翻译与本地化OLM的取代效应,表现为工作机会和收入的减少; 2) 网页开发OLM的生产力效应,表现为工作机会和收入的增加。 为了理解AI对自由职业者产生不同影响的原因,作者建立了Cournot竞争模型。 在竞争模型中,AI因为取代效应降低了市场潜力,但生产力效应降低了边际成本。 尽管是个简化模型,但它暗示每个职业都有一个拐点。 在AI达到某一职业的拐点之前,人类劳动能够从AI性能的进步中获益,体验到的是 生产力效应 。然而,一旦AI超越拐点,进一步提升AI性能,将对人类劳动产生负面影响,展现出 取代效应 。 为了更全面地描绘AI的影响,还进行了额外的 实证分析 ,展示AI如何影响不同类别的市场。这些估算结果进一步揭示了AI对自由职业者可能带来的两种不同情境。 此外,作者还考虑了ChatGPT 4.0的发布带来新的影响,并评估比较了ChatGPT 3.5和4.0的区别。实证结果揭示了这两次AI升级的三种模式:1)两种取代效应;2)从生产力效应过渡到取代效应;3)两种生产力效应。

值得注意的是,我们还没有从取代效应主导的模式过渡到生产力效应主导的模式,这与拐点假设相一致,表明一旦取代效应占主导地位,它将无法逆转。

实证背景

职业选择

作者将ChatGPT的发布视作一个外部冲击。ChatGPT于2022年11月30日发布,并对多种任务产生了显著影响。它是第一个获得主流认可的GenAI工具,因此成为研究AI冲击的理想对象。

在自由职业平台中,作者重点关注了两个受AI影响较大的工作市场,即 翻译与本地化和网页开发 ,这两个领域的LLM在执行相关任务时表现出了出色的能力。

首先,LLM在实际环境中完成各种翻译任务的能力已经得到验证。 研究人员和从业者已表明,ChatGPT与流行的翻译工具(如Google Translate和DeepL)不相上下,并且能生成上下文相关的内容。ChatGPT在某些语言考试中的表现甚至优于人类。 因此,作者选择了翻译与本地化OLM作为研究AI影响的一个重点。 其次,近期研究发现,使用GitHub Copilot时,网页开发人员实现HTTP网页的速度可以提升55.8%。 网页开发工作涉及多种任务,要求具备全面的技能,如编程能力、系统规划和设计专长。 虽然ChatGPT不能完全独立完成所有任务,但在调试代码和识别功能等方面,它已能够为人类程序员提供支持。因此,作者选择了网页开发OLM作为分析的另一个重点。 最后,作者选择了建筑设计OLM作为对照组,因为已有研究表明这是ChatGPT影响最小的行业之一。 将ChatGPT集成到像3D Max等建筑设计软件,仍处于概念阶段,AI还不能独立实施实际项目。因此,建筑设计OLM中的自由职业者可以作为一个良好的对照组。 此外,作者通过利用Felten等提出的AI职业暴露指数(AIOE)和谷歌搜索量指数(SVI),评估了ChatGPT对这三个市场的影响程度。 首先,作者将三个市场与AIOE指数进行映射,将每个市场与AIOE数据库中最相关的职业关联起来,并计算出平均AIOE指数,如图1所示。 其次,作者通过共同搜索ChatGPT和特定市场名称,获得了Google的搜索量指数(search volume index,SVI),并绘制了图2中的每周时间趋势。 结果表明,建筑设计OLM受到ChatGPT影响较小,而网页开发OLM和翻译与本地化OLM受到了更显著的影响,这支持了作者选择受影响市场和对照市场进行进一步分析。 数据与变量 作者通过定位平台提供的相关「专业」分类,识别了上述三种在线劳动力市场中的工人。 由于平台的数据检索限制,作者获得了来自建筑设计OLM的6743名工作者、翻译与本地化OLM的7582名工作者和网页开发OLM的1.5万名工作者的个人资料和工作历史。 随后,剔除了在2022年11月1日之前未接受任何工作的非活跃工作者,并按月将数据聚合到个人层面。 在文中,作者将与主要劳动市场相关的工作定义为「核心工作」,而将其他工作定义为「非核心工作」。通过关键词搜索,作者确定了自由职业者的核心工作。随后,基于工作者在给定月份接受的核心工作来构建度量,而非基于已完成的工作。 为了考虑ChatGPT发布前的潜在影响和假期效应,作者排除了2022年11月和12月的数据。因此,研究的时间框架涵盖了冲击发生前的六个月和冲击发生后的十个月,时间跨度为2022年5月1日至2023年10月31日。 表1提供了主要分析中 关键变量 的定义和描述性统计数据。

职场「双城记」

识别策略

为了考察AI对自由职业者的影响,作者使用了以下固定效应双重差分法(DiD)模型进行识别。 为了确保被处理组和控制组的工人可比,作者还使用了倾向得分匹配(PSM)方法,通过考虑工作者的经验、接受的核心工作总数、工资(即核心工作的平均价格和小时费率)以及工作质量(即核心工作的平均评分)来改善样本平衡。 所有这些变量只考虑了ChatGPT发布前的工作记录。 作者采用了1:1最近邻匹配策略,并排除了落在公共支持公共区域之外的观察值。 翻译与本地化在线市场 第一次分析考察了ChatGPT对翻译人员的影响,并将建筑设计OLM的工人作为控制组。 总体而言,论文发现,与建筑设计OLM相比,ChatGPT对翻译与本地化OLM产生了显著的替代效应。 在ChatGPT发布后,工作者们接受的核心工作数量的 绝对数显著下降了9.0% ,在相对意义上接受的核心工作数量也有所减少; 从核心工作中获得的收入也减少了29.7%。 这些结果表明,ChatGPT具备了足够的语言理解能力,能够处理翻译任务,从而对该领域的从业者产生了替代效应。 网页开发在线市场 作者的第二次分析考察了ChatGPT对网页开发人员的影响,同样将建筑设计OLM的工作者作为控制组。 与建筑设计OLM相比,ChatGPT发布后,网页开发人员的交易量 平均显著增加了6.4% 。在相对交易量方面也存在类似情况。 此外,ChatGPT的发布 显著提高了网页开发人员的月收入 ,增加了66.5%。 这些结果表明,ChatGPT不太可能自动化网页开发的过程,而是作为助手来提高了网页开发人员的生产力。 可能是因为网页开发工作需要多方面的知识和精心的规划,而ChatGPT从互联网文本中学习,难以成为合格的网页开发人员,从而对网页开发人员产生了生产力效应。

拐点猜想

AI 与职业的局部转折点

为了探讨为什么AI的进步对不同职业市场中的工人产生不同的影响,作者构建了一个微观模型来分析AI在作者实证背景中的作用。 考虑一个Cournot竞争模型,其中有n个工人,每个工人都以相同的边际成本提供相同的服务。 这个模型包含 三个基本概念 。 首先, 职业 代表市场中的一种工作类别,在本研究的背景下通常被称为OLM(职业劳动市场)。 其次, 工作 是发布在自由职业平台上的具体项目或任务。 最后, 任务 是成功完成工作所需的最小认知单元。 该模型基于由多个任务组成的工作。 假设边际成本为(1−a)c,其中c>0,a∈[0, 1]。作者将 a 解释为在提供服务过程中, AI能够成功完成任务的百分比 。因此,c表示工人在没有使用任何AI帮助的情况下的边际成本。 服务的 市场需求 由以下公式确定: 其中p为价格,qi为工人i提供的服务数量,S(a)表示市场潜力。 S(a)随着a的增加而递减 。 对于那些AI技术更为熟练的潜在雇主,AI可以 更可靠且更能胜任 他们发布的主要工作,这使得他们更倾向于用AI替代人工劳动。 随着AI的改进,即a的增加,更多潜在的雇主会进入这一类别,从而减少市场潜力。此外,S(a)可能是凹函数的,因为技术的采用通常随着技术的成熟而加速。 有几种可能的机制。 首先,随着AI表现的提高,更多的雇主将使用它,这会产生更多的口碑推荐,从而促进更多的采用。 其次,由于更多雇主使用AI,会产生积极的外部效应,因为AI的使用传播了专业知识和最佳实践。 第三,创新型企业将开发专门的软件来帮助特定职业使用AI,因为随着AI变得越来越强大,它能够帮助完成这一类工作。作者对技术假设进行了约束:|S′(0)|c,以避免出现不相关的情况。 工人的目标是获取最大利润: 最后的Nash均衡(Nash equilibrium)状态下的价格、利润和收入为 附加一些对S(a)函数的技术性假设,最后作者的得到了「拐点猜想」:

简而言之, 在AI的能力比较低时, a小于「拐点」 ,相关岗位 数量和利润 会随着AI能力的增加而 增加 ;但当AI的能力足够大时, a大于「拐点」 ,AI能力越强,相关岗位的 数量、收益、利润越少 被AI消灭的岗位数量越多 。而且一旦超越拐点,替代效应将无法逆转。 其他岗位分析 利用其他市场的交易数据,论文研究了AI在不同职业劳动市场(OLM)中的异质性影响。 在主分析中包含的职位类别之外,作者为每个额外的类别选择了一个特定的职业劳动市场,并采用与主分析相同的方法进行研究。 不同模型的结果(见表6)揭示了AI的两种不同效应,表明 不同职业有不同的拐点 此外,作者进一步考虑了2023年3月14日发布的ChatGPT 4.0作为AI的第二次升级,并估算了ChatGPT 3.5和4.0对上述十一种职业劳动市场(OLM)的影响。 以下是用于估算的固定效应双差分(DiD)模型。 根据「拐点猜想」,只有三种可能的结果:

1)持续保持生产力效应:AI在两次升级后仍低于拐点。

2)从生产力效应转变为取代效应:AI在第一次升级后没有达到拐点,但在第二次升级后超过了拐点。

3)持续保持取代效应:AI在第一次升级后超过拐点,并在第二次升级后继续超过拐点。

表7中呈现的结果证实了这三种结果同时存在,而且没有任何市场经历能从取代效应转变为生产力效应。

这一发现表明,一旦 AI 越过了某项工作的拐点,随着进一步升级,AI不可能恢复到拐点以下。

具体结论与建议

写作 相关的OLM(例如,专业与商业写作) 特别容易受到取代效应的影响

咨询 相关的OLM(例如,国际法与移民法)通常为客户提供专门的建议以支持其决策,随着ChatGPT能力和知识库的扩展,这些领域可能 越来越面临取代效应 。 与 编程 相关的OLM(例如,网页开发),在这些领域,ChatGPT表现良好, 目前正经历生产力的提升 。然而,ChatGPT有可能取代程序员,并 最终导致未来的取代效应 。 相比之下,与 运营 相关的OLM(例如,项目管理)和 创意 相关的OLM(例如,摄影)需要大量的 人际互动、专门知识或创造性思维 ,而ChatGPT在这些方面的能力较弱。因此,这些市场可能 会继续经历显著的生产力提升 。 与以往在宏观层面进行AI与劳动关系的研究相比,新模型是在微观层面上进行的,结合了大语言模型的内在特性和工作特征。这些发现 对未来工作具有重要的实践意义 。 从工作者的角度来看,这项研究突出了AI的双重作用。一方面观察到某些市场的衰退,促使个人 重新考虑职业道路 。与此同时,鼓励从业者 与AI合作 ,提升生产力,并在繁荣的市场中抓住机会。 平台方面,也建议进行战略性 资源重新配置 ,如创建基于AI的新型工作市场。在快速发展的数字经济中,这些调整将有助于平台保持竞争优势。

作者简介

夏威夷系统科学年会,全称Hawaii International Conference on System Sciences,简称HICSS,是信息系统技术领域历史最悠久的科学会议。

自1968年以来,它吸引了世界各地来自学术界、工业界和政府机构的高水平学者和专业人士,来展示他们的前沿研究。过去的五十年中,在HICSS上发表的研究论文有效促进了全球范围内信息系统和技术的创新和发展。

Dandan Qiao ,2018.07-至今任新加坡国立大学信息与分析系统助理教授。 她在2018年获得清华大学信息系统博士学位,本科毕业于北京邮电大学信息系统专业,曾 在2015.08-2017.09期间前往德克萨斯大学奥斯汀分校进行访学。

Huaxia Rui,目前任罗切斯特大学西蒙商学院施乐计算机与信息系统讲座教授。

从2000-2007年,他在清华大学攻读控制理论与工程学士和硕士学位,之后前往 德克萨斯大学奥斯汀分校攻读经济学系硕士和麦考姆斯商学院博士。

博士毕业后,入职罗切斯特大学西蒙商学院,先后任助理教授、终身副教授、教授。

Qian Xiong,目前是清华大学与新加坡国立大学联合培养博士生。2020年,于武汉大学获得土木工程工学学士学位

来源:东窗史谈

相关推荐