人工智能背后藏着庞大的劳动力:随着技术的发展,会变得多余吗?

B站影视 内地电影 2025-05-17 17:40 2

摘要:这对于在史诗般的全球AI霸主之争中胜出者至关重要。开发人员现在正在重新考虑所需的硬件、能源和数据量。然而,机器智能中另一个较少被讨论的投入也在不断变化:劳动力。

去年年底,中国热门公司deepseek发布了其廉价的大型语言模型,颠覆了长期以来人们对构建下一代人工智能 ( AI ) 所需条件的假设。

这对于在史诗般的全球AI霸主之争中胜出者至关重要。开发人员现在正在重新考虑所需的硬件、能源和数据量。然而,机器智能中另一个较少被讨论的投入也在不断变化:劳动力

对于外行人来说,人工智能就是机器人、机器和模型。它是一项扼杀就业的技术。事实上,有数百万的从业者参与制作人工智能模型。

他们的大部分工作涉及诸如在道路图像中标记物体以训练自动驾驶汽车,以及在用于训练语音识别系统的音频记录中标记单词等任务。

从技术上讲,注释器为数据提供计算机所需的上下文信息,以便计算出数据集各组成部分与其对人类的意义之间的统计关联。事实上,任何完成过验证码测试(选择包含斑马线的照片)的人,都可能无意中帮助训练了人工智能。

正如数据公司Scale AI的老板 Alex Wang 所说,这是该行业“不那么性感”的部分。

尽管 Scale AI表示其大部分贡献者的工作都在美国和欧洲进行,但整个行业的大部分劳动力都外包给了世界贫困地区,那里有很多受过教育的人正在寻找工作。

中国政府已与阿里巴巴和京东等科技公司合作,将注释工作带到该国偏远地区。在印度,IT行业机构 Nasscom 估计,到 2030 年,注释收入可能达到每年 70 亿美元,并提供100万人的就业机会。

这个数字意义重大,因为印度整个IT行业每年的价值为2540亿美元(包括硬件),并提供550万人的就业机会。

长期以来,注释者一直被比作父母,教导模型并帮助他们理解世界。但最新的模型并不需要他们以同样的方式指导。随着技术的发展,这些“老师”是否会变得多余?

数据标注并非新鲜事。被誉为“人工智能教母”的美国计算机科学家李飞飞,在21世纪初创建了当时最大的图像数据集ImageNet,为该行业打响了第一枪。

李飞飞意识到,如果她花钱请大学生对图像进行分类(当时大多数研究人员都是这样做的),这项任务将需要90年的时间。于是,她利用亚马逊运营的在线零工平台Mechanical Turk在世界各地雇佣员工。

在两年半的时间里,她将大约320万张图像整理成数据集。很快,其他人工智能实验室也开始以这种方式外包标注工作。

随着时间的推移,开发人员对零工网站上未经培训的工人所做的低质量注释感到厌烦。Sama和 iMerit 等人工智能数据公司应运而生。他们雇佣了来自贫穷世界的工人。

非正式的注释工作仍在继续,但出现了专门用于人工智能工作的平台,比如 Scale AI运营的平台,该平台对工人进行测试和培训。

世界银行估计,全球劳动力的 4.4% 到 12.4% 从事零工工作,包括人工智能注释。密歇根州居民 Krystal Kauffman 从事在线数据工作已有十年,她认为科技公司有兴趣隐藏这些劳动力。

“他们在出售魔法——这种想法是所有这些事情都会自行发生,”考夫曼女士说。“如果没有魔法,人工智能就只是另一种产品。”

业内一直存在关于AI背后员工待遇的争论。公司不愿透露工资信息。但美国注释员通常认为在线平台上每小时10-20美元的工资还算合理。而贫穷国家的注释员通常每小时能拿到4-8美元。

许多人必须使用监控工具来追踪他们的电脑活动,并会因为速度慢而受到惩罚。Scale AI因其雇佣行为已遭遇多起诉讼。该公司否认存在不当行为,并表示:“我们计划积极为自己辩护。”

然而更大的问题是,基础的注释工作正在枯竭。从某种程度上来说,这是不可避免的。如果说人工智能曾经是一个需要父母指点并帮助它理解周围世界的幼儿,那么它现在已经成长为一个需要偶尔获得专家指导和建议的青少年。

人工智能实验室越来越多地使用来自其他人工智能实验室的预先标记数据,这些实验室使用算法将标签应用于数据集。

以农业设备巨头约翰迪尔(John Deere)的子公司蓝河科技(Blue River Technology)开发的自动驾驶拖拉机为例。

三年前,该集团在美国的工程师会将农田照片上传到云端,并向印度胡布利的iMerit员工提供详细的标注说明:拖拉机、建筑物、灌溉设备。现在,开发人员使用预先标注的数据。

他们仍然需要iMerit员工检查标注,并处理“极端情况”,例如尘土飞扬遮挡了部分景观,或者树木遮蔽了农作物,导致模型混乱。这个过程原本需要几个月,现在只需要几周。

从小步开始

最新一波人工智能模型浪潮更为显著地改变了数据工作。自 2022 年 Open AI首次向公众开放其 Chat GPT聊天机器人以来,人们对大型语言模型的兴趣日益浓厚。

研究公司 Pitchbook 的数据显示,2024年,全球对人工智能初创企业的风险投资增长了 50% 以上,达到 1315 亿美元,而同期对其他初创企业的资金却有所下降。

其中大部分资金流向了开发人工智能的新技术,这些技术不需要以同样的方式对数据进行注释。社会企业 Humans in the Loop 的 Iva Gumnishka 表示,为老牌计算机视觉和自然语言处理客户进行低技能注释的公司正在“落后”。

对注释员的需求仍然存在,但他们的工作已经发生了变化。随着企业开始部署人工智能,他们正在构建更小的专业模型,并寻找受过高等教育的注释员来提供帮助。

注释工作广告要求博士学位或具备编码和科学技能已变得相当普遍。现在,研究人员正试图让人工智能更加多语言化,对讲英语以外语言的注释员的需求也在增长。

在 iMerit 从事医疗人工智能项目的牙医 Sushovan Das 认为,注释工作永远不会消失。“这个世界在不断发展,”他说。“所以人工智能需要一次又一次地改进。”

人类在人工智能训练中的新角色正在涌现。研究公司 Epoch AI估计,到 2026 年,可用于训练的高质量文本资源可能会枯竭。一些人工智能实验室正在聘请人员编写用于训练模型的文本块和代码行。

另一些实验室则购买使用计算机算法创建的合成数据,并聘请人工进行验证。“合成数据仍然必须是优质数据,”在东非开展业务的南非货币管理局 (Sama) 首席执行官温迪·冈萨雷斯 (Wendy Gonzalez) 表示。

工作人员的另一个职责是评估模型的输出并协助完善。这正是 Chat GPT表现优于以往聊天机器人的原因。Scale AI的 Xiaote Zhu举例说明了该公司 Outlier 平台上正在进行的开放式任务。

该平台于 2023 年推出,旨在促进专家对人工智能的培训。工作人员会收到一个聊天机器人的两条回复,推荐马尔代夫度假行程。他们需要选择自己喜欢的回复,对其进行评分,解释答案好坏的原因,然后重写回复以改进。

朱女士的例子相当平淡无奇。然而,人类的反馈对于确保人工智能的安全和道德也至关重要。

Open AI在 2022 年推出 Chat GPT后发布的一份文件中表示,它已聘请专家对其模型进行“定性探究、对抗性测试并提供总体反馈”。

在这个过程结束时,该模型拒绝回应某些提示,例如要求撰写旨在劝说人们加入恐怖组织基地组织的社交媒体内容。

如果人工智能开发者能够随心所欲,他们根本不需要这种人工输入。研究表明,人工智能开发中高达 80% 的时间都花在了数据工作上。

人工智能公司 Databricks 的 Naveen Rao 表示,他希望模型能够自学,就像他希望自己的孩子一样。“我希望培养具有自我效能感的人,”他说。“我希望他们拥有自己的好奇心,并能找到解决问题的方法。我不想在每一步都给他们填鸭式地灌输。”

无监督学习(指向模型输入未标记的数据)和强化学习(利用反复试验来改进决策)备受瞩目。

包括谷歌 DeepMind 在内的人工智能公司已经通过与机器进行数百万次自我对弈并追踪哪些策略有效,训练机器在围棋和国际象棋等游戏中获胜,整个过程完全无需任何人工干预。但这种自学方法在数学和科学领域之外并不适用,至少目前如此。

DeepSeek 模型的低成本和高效让世界各地的科技达人赞叹不已。但他们对 DeepSeek 试图利用计算机而非人类的反馈来训练人工智能的做法却不太感冒。

该模型在回答开放式问题时举步维艰,用各种语言写出一堆乱七八糟的胡言乱语。

“不同之处在于,围棋和国际象棋的预期结果非常明确:赢得比赛,”另一家人工智能数据公司 Prolific 的联合创始人菲利姆·布拉德利 (Phelim Bradley) 表示,“大型语言模型更加复杂,影响也更加深远,因此人类将在很长一段时间内保持领先地位。”

与许多技术人员一样,布拉德利认为,需要更多人参与人工智能的训练,而不是更少人。劳动力的多样性很重要。几年前,当 Chat GPT发布时,人们注意到它过度使用了“delve”一词。这个词被视为“ AI -ese”,这是文本是由机器人编写的明显迹象。事实上,他们聘请了非洲的注释员来训练该模型,而且“delve”一词在非洲英语中的使用频率比在美式英语或英式英语中更高。正如工人的技能和知识被转移到模型一样,他们的词汇量也会被转移到模型中。事实证明,养育一个孩子需要的不仅仅是一个村庄的努力。

文本来源@《经济学人·商论》 的内容

来源:奇葩综艺说

相关推荐