AI 训练=人类学习?版权争议背后的危险类比

B站影视 韩国电影 2025-09-25 20:25 1

摘要:人工智能早已经从科幻世界走向了生活现实,影响着人们的日常生活、国计民生甚至国际关系。从技术开发目的的角度,人工智能的产生就是为了在某种层面替代甚至超越人类,但当它似乎真的可以超越人类之时,我们却出于自我保护的本能和伦理,对其性能和法律地位充满疑虑。

人工智能早已经从科幻世界走向了生活现实,影响着人们的日常生活、国计民生甚至国际关系。从技术开发目的的角度,人工智能的产生就是为了在某种层面替代甚至超越人类,但当它似乎真的可以超越人类之时,我们却出于自我保护的本能和伦理,对其性能和法律地位充满疑虑。

关于人类学习与AI训练之间的关系,我们近期观察到法律和科技领域的2个重要动态:其一,2025年6月23日,美国一位地方法官就Bartz v. Anthropic作出了人工智能对版权内容的使用属于“合理使用”的判决,其理由之一是,该法官认为人工智能训练与人类学习类似;其二,2025年8月,美国布朗大学发布的一项研究发现,人类和人工智能在整合两种学习方式方面存在相似之处,该团队的工作表明,分析人工神经网络中不同学习策略的优势和劣势可以提供有关人类大脑的新见解。

下面这篇文章,是一位版权倡导者对第一个动态美国法庭判决的的回应,其中也包含了部分对第二个科学研究的质疑。这篇文章提醒我们,对于AI训练与人类学习之间的关系,我们应该慎重地进行比较;当然,法律研究也不应该忽略科学研究的最新进展,以免我们陷入盲目的洞穴。

在版权语境下,将人工智能“拟人化”这个问题至关重要,因为如果运用不当,版权法似乎根本不应适用于人工智能的使用。这种做法是错误且危险的,因为它将人工智能置于人权之上。声称人工智能像人类一样“学习”的说法尤其具有破坏性。虽然说人工智能从创意作品中“学习”听起来可能像一位有抱负的艺术家或一位学生学习先前作品一样无害,但实际上,这种类比并不恰当,因为人类的“学习”规模和速度根本无法与人工智能在未经授权的情况下大规模抓取和吸收受版权保护的作品相提并论。

创作者之所以被赋予某种“权力”,是为了激励创造,从而促进学习、文化和作品的传播。版权法推动对科学研究和文献的投资,通过创新课程推动学习,并通过创作各种重要的教育材料来支持教学需求。正是由于这些版权类的法律,创意经济成为一种可持续发展的动力,当世界经济发展处于不确定时,创意经济提供了更具保障的增长潜力。

现在,维护和尊重版权法至关重要,否则,由于人们错误地认为人工智能会像人类一样“学习”,人工智能机器及其开发公司在版权法下会得到比人类更好的待遇。正如演员兼艺术家倡导者约瑟夫•高登-莱维特所指出的:“一旦我们开始说人工智能在法律面前与人无异,我认为我们就是在自找倒霉。人工智能不是人……误以为这些科技产品就是人,这对我们来说非常危险。”

人工智能训练与人类学习之间存在着显著差异,而这些差异在版权分析中至关重要。最近,法院在“Bartz诉Anthropic”案(以下简称Anthropic案)中将人工智能拟人化,将人工智能训练等同于“训练小学生如何写好文章”,并指出:

每个人都会阅读文本,然后创作新的文本。他们或许一开始需要付费才能获得文本。但要让任何人每次阅读、每次回忆、每次以新方式创作新作品时都专门为使用书籍付费,这简直不可想象。几个世纪以来,我们反复阅读书籍。我们欣赏、记忆并内化了它们宏大的主题、实质性的观点以及它们针对反复出现的写作问题提出的文体解决方案。

但Anthropic案法庭的分析在很多层面上都从版权角度站不住脚。

首先,从技术层面来看,生成式人工智能训练涉及复制和保留创意作品的完整版本,其规模是人类学习无法比拟的。无数法律、政策和艺术专家都认识到这一重要差异,并以此为由全盘否定了这种类比。

在另一起关于Meta侵犯版权的人工智能案件(Kadrey v. Meta)中,法院强调了人工智能训练的重复性过程,即为了表达价值而获取文本,然后“数十亿或数万亿次地用不同的文本”进行复制、拼接、配对和拼凑。在本案中,法院得出结论:“这不是人类读书的方式。”同样,美国版权局在其关于生成式人工智能训练的报告中,也否定了人工智能训练与人类学习的类比,并指出了更多差异,指出:

人工智能学习与人类学习之间存在显著差异,这些差异对版权分析至关重要。人类对所体验的作品仅保留不完美的印象,这些印象会受到自身独特个性、历史、记忆和世界观的影响。而生成式人工智能训练则涉及创建完美的副本,并具有几乎即时分析作品的能力。

这与简•金斯伯格教授和罗伯特•布劳内斯教授等颇具影响力的版权法学者的观点一致,后者指出:“生成模型训练超越了专有权结构背后的人类局限性。”金斯伯格教授在一次采访中驳斥了将人工智能训练与人类学习进行类比的说法,他表示:

我不同意这种类比。因为人不是机器,机器会复制。这些机器的复制规模非常大。我认为这是显著的区别。例如,即使你是一名艺术系学生,你看《宫娥》是因为你想研究委拉斯开兹,并且你想根据《宫娥》创作自己的变体,你也可能会画草图。没有人会因为你在私人学习时画草图而认为你侵犯了版权。但这些系统却在大规模地进行复制。

Meta案中,法院解释了人工智能训练与人类学习之间的另一个关键区别。在反驳Anthropic案中类似做法时,Meta案的法院讨论了规模问题,但也指出:

“就市场效应而言,用书籍教孩子写作与用书籍创造一种产品截然不同,个人可以用这种产品以极少的时间和创造力创造出无数相互竞争的作品。”

Stability AI 前高管 Ed Newton-Rex 也指出:“一个人工智能,经过全球所有内容的训练,就能产生足够的输出来取代大部分内容的需求。没有任何一个人能够以这种方式扩展……”他进一步解释道:

“人类学习是长期确立的社会契约的一部分。每个创作者写书、画画或创作歌曲时,都清楚其他人会从中学习。这已被定价。但人工智能绝对不是这样。这些创作者创作和发布作品时,并没有期望人工智能系统能够从中学习,然后能够大规模地创作出与之竞争的内容。人工智能训练行为本身就不存在社会契约。”

在将人工智能训练等同于人类学习的同时,Anthropic案的法庭也忘记了人类学习有成本的。人们会购买书籍,购买音乐会或戏剧表演的门票,付费订阅音乐流媒体服务来听歌,在电视节目中观看广告和商业广告。博物馆、学校和图书馆也同样受到纳税人资金或私人捐款的支持。这些只是在版权法的激励机制下,为体验创意作品而进行价值交换的少数交易。

将人工智能拟人化为“学习”的说法,最终导致了将学习和知识等同于“免费”的谬论。归根结底,学习对人类来说并非免费,对人工智能公司来说也不应该免费——尤其是在人工智能利用人类创作的作品进行训练,然后取代这些作品的市场,同时为科技公司创造收入和利润的情况下。

此外,美国《版权法》第107条规定的合理使用抗辩中也没有明确规定学习的例外。教育工作者在课堂上使用受版权保护的作品进行教学时,并没有被广泛地豁免于版权法。学校和学生需要支付教科书和其他学习材料的费用。

正如美国版权局在其报告中指出的那样:

“这个类比建立在一个错误的前提之上,因为合理使用并不能为所有以学习为目的的人类行为提供借口。学生不能依赖合理使用来复制图书馆里的所有书籍以促进个人教育;相反,他们必须购买或借阅合法获得的副本,通常是通过销售或许可。版权法不应仅仅因为复制是由计算机完成的就赋予更大的自由度。”

正如法院在Meta案中指出的那样,将人工智能训练等同于人类学习的“不恰当的类比”并不能成为忽视合理使用分析中最重要因素的依据。人类学习没有全面的例外,因此人工智能训练也不能有全面的例外。

当我们考察人工智能训练与人类学习如何应用这些过程来实现最终结果时,就会发现它们之间存在一个关键区别。与人工智能不同,人类创造者可以跟随同一位老师学习同一套教材,学习相同的课程,采用相同的方法,却展现出独特的技能和丰富的创造性表达。

约瑟夫·高登-莱维特谈到了他与神经科学家关于将人工智能训练等同于人类学习的对话,这解释了为什么这种类比是如此错误。他指出:

甚至从技术角度来看,这种处理 1 和 0 的算法,其运作方式也与大脑运作方式截然不同。他们称这项技术为神经网络,因为它在某种程度上受到了神经元运作方式的启发……我采访过的大多数神经科学家对此都翻了个白眼,说,看,它们确实存在某些相似之处。没错,你的大脑也有神经元,神经元可能会放电,也可能会不放电。但这只是大脑运作方式的冰山一角。坦率地说,我们科学界甚至根本不了解大脑内部究竟发生了什么。所以,把这些神经网络与人类进行比较,实在是过于简单粗暴了。尤其愚蠢的是,他们声称这些神经网络在法律下应该享有与人类同等的权利。所以,对我来说,这根本算不上什么真正的论点,而只是优化业务的借口而已。

与人工智能不同,人类创作富有表现力作品的能力并非仅仅取决于其一生中阅读、聆听、观看和感知的海量优质且封闭的创意作品库。人类创作者创作诗歌、小说、歌曲、摄影或任何其他创意作品的技能,总是需要独特地运用个人经历、情感、独特的个性和声音、技术训练和教育、与生俱来的技能和能力,以及对其一生中接触过的先前创意作品的记忆。而人工智能不具备这些特质。

相比之下,人工智能模型仅利用输入的海量数据。它们不会运用上述任何人类固有的反应来生成输出。如果没有那些被盲目复制并输入机器的受版权保护的素材,人工智能完全无法独立生成输出。这意味着它的训练过程根本无法像人类学习那样。

人工智能与人类之间的类比或许有助于解释人工智能的机制。但它们不应被用来替代传统的法律和政策分析,尤其是在将版权侵权和合理使用原则应用于人工智能时。这样做会导致法律的误用和不良的版权法政策,从而损害人类创作者和公众的利益。这种误导性的政策也会损害人工智能开发者的利益。

如果没有人类创作的作品,人工智能公司将无法开发出维持其现金地位的模型,因为它们缺乏开发领先人工智能模型所需的关键、高质量、富有表现力的材料。

版权法是一个久经考验的框架,学习和知识正是在此框架下创造、发展和推广的——在生成人工智能时代,它可以继续提供相同甚至更多的创新。

相关阅读

Anthropic 胜诉引爆AI版权革命:训练数据"合理使用"获美国司法认可

英国AI版权“立法实验室”启示录:创新松绑vs创作者权益,中国如何借鉴?

生成式AI重写创意产业规则,仅靠版权无法保护创意作品的未来

OpenAI 吉卜力滤镜狂欢背后:AI正在重塑艺术创作的“法律边疆”——超越版权法?

OpenAI 要求破除版权障碍训练AI:“国家安全”名义下的盗版,还是AI发展的必然?

人机协同时代的版权困局:人工智能版权治理与创新研讨会深度解析

从中美司法实践剖析与比较AIGC的可版权性

作者:Rachel Kim

美国版权联盟的副总裁、法律政策和版权顾问,致力于倡导和教育创意社区并向其宣传各种国内和国际版权政策问题,包括人工智能、CCB 法规、版权局、现代化、法规、注册实践以及其他版权和政策举措。

编译:《互联网法律评论》

【免责声明】本文撰写所需的信息采集自合法公开的渠道,我们无法对信息的真实性、完整性和准确性提供任何形式的保证。本文仅为分享、交流信息之目的,不构成对任何企业、组织和个人的决策依据。

《互联网法律评论》提供业界解决方案

互联网法律国际监管动态研究

互联网产业投资和政策监管研究

互联网企业:极端地缘政治冲突中的公关战略研究

互联网法律评论

《互联网法律评论》是一个全新的法律自媒体平台,持续关注中国及全球互联网科技发展、产业发展和法律监管合规问题,尤其是数据安全与个人隐私保护、知识产权、反垄断等政策监管主题。

该公号运营团队包括:国际国内互联网政策和法律研究、财经媒体资深主编、互联网企业公关战略和品牌运营等不同的专业人士,致力于打造一个持续输出政策法律前瞻信息研究、且具有传播优势的精品平台。

来源:互联网法律评论

相关推荐