摘要:当地时间2025年1月29日,美国版权局发布关于人工智能生成内容(AI-generated content,以下简称“AIGC”)的可版权性问题的最新报告(以下简称“美国版权局最新报告”)。
作者 | 寿步
上海交通大学 教授
目次
一、引言
二、若干术语的翻译说明
三、美国版权局最新报告译评
四、结语
一、引言
当地时间2025年1月29日,美国版权局发布关于人工智能生成内容(AI-generated content,以下简称“AIGC”)的可版权性问题的最新报告(以下简称“美国版权局最新报告”)。
关于为什么中国首例AI文生图案应当再审的话题,笔者已经先后发表《为什么中国首例人工智能文生图案应当再审?》(以下简称“《一论》”)、《再论为什么中国首例人工智能文生图案应当再审?——基于Sora Turbo的用户体验过程的视角》、《三论为什么中国首例人工智能文生图案应当再审?——基于豆包“文生图”和“文生文”过程的视角》、《DeepSeek生成内容的可版权性问题——四论为什么中国首例人工智能文生图案应当再审》(以下简称“《四论》”)四篇文章。
本文将基于美国版权局最新报告对中国首例AI文生图案进行评论。
二、若干术语的翻译说明
版权领域术语的翻译常有不同见解。为了方便从译文追溯原文的用词、准确理解原文,下面给出笔者对若干术语的译名。因为篇幅所限,对翻译理由仅作简要说明。
(1)Copyright,Copyrighted,Copyrightable,Copyrightability:依次译为“版权”、“有版权的”、“可版权的”、“可版权性”。后三个词的译名尤其方便中文读者看到译名即可直接回溯到原文。
(2)Author,Authorship:在版权语境下依次译为“作者”、“作者身份”,不译为其它。ship作为词根有多方面的含义,其中包括职业、身份、技能、才能、状态、性质、关系等。authorship中的ship词根就涉及这些含义。
(3)Authored:在版权语境下译为“创作”“撰写”等。由authored衍生出来的human-authored,在涉及AI的语境中通常是与AI-generated相对的;它在不同语境下的翻译主要有“人类创作的”“人类撰写的”。美国版权局最新报告是在版权语境下进行讨论,因此本文将human-authored译为“人类创作的”。
(4)Original,Originality:在版权语境下依次译为“原创的”、“原创性”,尤其是它们不宜译为“独创的”、“独创性”。因为“独创”的“独”字在中文语境下含有“独特的”之义,往往被理解为“独一无二的”,而版权法保护作品所要求的originality并不要求作品是“独特的”乃至“独一无二的”,而是仅仅要求作品是作者自己创作的。因此,需要避免“独”字可能带来的误解。
(5)Idea:在版权语境下译为“创意”。理由详见:寿步著《计算机软件著作权保护》,清华大学出版社,1997年版第11-32页;寿步《论版权与专利若干基本概念——试议美国版权法第102条的翻译》,载中国专利局专利法研究所编《专利法研究1997》年刊,专利文献出版社,1997年版,第235-254页(https://cpfd.cnki.com.cn/Article/CPFDTOTAL-GJZS199712001017.htm)。
(6)Expression,Express,Expressing:在版权语境下都译为“表达”。理由同上。
(7)Expressive:在版权语境下译为“有表达力的”。基于同上理由,本来expressive可以与expression、express、expressing可以同样简译为“表达”,但是考虑到“expressive element”一语在美国版权局最新报告中的突出地位,特将expressive译为“有表达力的”,因而将expressive element译为“有表达力的元素”,以便读者清楚了解expressive的特定意蕴,并与其它无法说明其特定意蕴的译名相区别。根据《在线词源词典》(https://www.etymonline.com),作为形容词的expressive的词源是:大约1400年,“倾向于挤压出来”,源自法语expressif,源自expres 清晰,明确”,源自拉丁语exprimere的词干 “挤压出来”,也表示“描述,描绘”。意思是“充满表达”,来自1680年代。(https://www.etymonline.com/cn/word/expressive#etymonline_v_32880)在版权语境下将expressive译为“有表达力的”,与将expression、express、expressing同译为“表达”,将expressible译为“可表达的”、expressiveness译为“表达力”都是基于对版权理论中的创意/表达两分法(idea/expression dichotomy)进行中文精准阐释的需要。
(8)AI-generated Content,AI-generated Material,AI-Generated Output:在美国版权局最新报告中这些措辞在字面上不同,可依次译为“AI生成内容”、“AI生成材料”、“AI生成输出”,但是它们的含义在本质上相同。
(9)Arrange,Arranging,Arrangement:在版权语境下都译为“编排”。
(10)Authorship by Adoption:译为“采收式作者身份”。常见于两种语境:一是学术/文学语境,强调通过吸收他人的思想或文本,经创造性转化后形成的新版权,强调思想整合(如《文心雕龙》对儒家经典的化用),有译为“因采纳/采用而确立的作者身份”;二是法律/版权语境,指通过法定程序承继作品权益的情况,如遗作托管,侧重权利转移(如基金会接管卡夫卡手稿的著作权),有译为“收养型著作权”。本文以“采收”兼纳adoption的“采纳/采用”和“收养”之义。
(11)The U.S. Copyright Office:从习惯译为“美国版权局”。为方便识别,该报告中所有的the Office也译为“美国版权局”。
三、美国版权局最新报告译评
1.概况
美国版权局最新报告是名称为《版权与AI》的总报告的第二部分“可版权性”(Copyright and Artificial Intelligence,Part 2: Copyrightability)。
正如美国版权局2023年 8月发出的调查通知(Notice of Inquiry)所述,《版权与AI》报告是专门处理版权与AI相关的法律和政策问题。该报告将分为若干部分先后发布,每个部分涉及不同的主题。第一部分于2024年7月31日发布,探讨了数字复制品的主题——使用数字技术真实地复制个人的声音或外表,建议美国联邦立法应对未经授权分发真实但虚假描绘个人的数字复制品。本次发布的第二部分(就是本文所称的“美国版权局最新报告”)探讨了使用生成式AI创作的作品的可版权性问题。尚未发布的后续部分将转向在有版权的作品上训练AI模型的法律影响,包括许可考量和任何潜在责任的分配。
2023年初,美国版权局宣布了一项探索版权和AI交叉领域的倡议。同年3月,该局发布一份政策声明,为包含AIGC的作品提供了注册指南。此后,该局开展了一系列活动推进此事。同年 8月该局发布调查通知,正式征求公众对所提出的各种版权问题的意见。此后,该局收到了来自全球67个国家的社会各界、代表广泛观点的10000多条评论。这些投入,加上该局从其他机构收到的额外研究和信息,构成了本次美国版权局最新报告讨论和建议的基础。
本文中该报告的译文均由笔者翻译并享有译者的版权,若有引用请注明出处。原文的注释根据需要偶有译出;译出时已注明“原注”。译文中一些文字的加粗、加黑和加下划线是由译者加入,以示提醒。
该目录的译文如下:
“一.导言
A.技术和版权
B.美国版权局的AI倡议
二.作者身份与AI
A.技术背景
B.法律框架
C.AI系统的辅助使用
D.提示语
1.评论者的观点
2.分析
E.有表达力的输入
F.修改或编排AIGC
三.国际的方法
四.法律变革的论据
A.提供激励
B.赋权残疾创作者
C.应对国际竞争
D.提供更高的清晰度
五.结论”
2. 执行摘要
美国版权局最新报告的“执行摘要”(EXECUTIVE SUMMARY)的完整译文如下:
“美国版权局关于版权和AI的报告的第二部分处理AI系统生成的输出的可版权性。它分析了足以将这些输出纳入美国版权保护范围(所需)的人类贡献的类型和水平。
在美国版权局收到的对其调查通知的10000多条评论中,大约一半涉及可版权性。绝大多数评论者都认为,现行法律在这方面是足够的,完全由AI生成材料不是可版权的。
然而,评论者对于涉及某种形式的人类贡献的生成式AI输出的保护则意见不一。他们对现行法律下何种类型和数量的贡献可以构成作者身份表达了不同意见。许多人还强调,这一领域需要更加明确,包括在创作过程中将AI用作工具。
作为政策问题,一些人认为,将保护范围扩大到生成式AI创建的材料将鼓励创作更多的有作者身份的作品,促进文化和知识的进步,造福公众。美国版权局也听到了关于AI生成输出的增加会破坏人类创造的动力的担忧。
认识到可版权性是逐个案件确定的,但在本部分中,美国版权局列出了统辖分析的法律原则,并评估了这些原则在AI生成内容中的适用性。
第一节指出了AI技术引起的可版权性问题,概述了使版权法适应新技术发展的历史,描述了美国版权局正在进行的AI倡议。
第二节简要介绍了所涉技术的背景,然后总结了现有的法律框架,特别是人类的作者身份的要求、创意/表达二分法和版权保护的原创性标准,在讨论了在有作者身份的作品的创作过程中使用AI来协助作者之后,分析了如何将法律适用于对AI生成输出的人类贡献的各种类型:提示语,人类创作的有表达力的输入的夹杂物,以及AI生成输出的修改或编排。
第三节报告了国际形势。它描述了其他国家如何在自己的法律体系内探讨可版权性的问题。
第四节探讨了为AI生成材料提供额外的法律保护的政策影响,评估了支持和反对立法变革的论点。根据对版权法律和政策的分析,以及对我们的调查通知的许多深思熟虑的评论。
美国版权局得出以下结论和建议:
(1)可版权性和AI的问题可以根据现行法律解决,而不需要立法变革。使用AI工具来协助而不是代替人类的创造力并不影响对(AI生成)输出的版权保护的可用性。
(2)版权保护由人类作者创作的作品中的原创的表达,即使该作品也包含AI生成材料。
(3)版权并不延及纯粹的AI生成材料,也不延及人类对有表达力的元素控制不足情况下的材料。
【译者按:注意,根据下列第(5)项,中国首例AI文生图案所涉的正是“仅有提示语并不能(对有表达力的元素的)提供足够的控制”的情况,因此,版权不延及该案中“人类对有表达力的元素控制不足情况下的材料”。】
(4)人类对AI生成输出的贡献是否足以构成作者身份,必须逐个案件分析。
(5)基于当前普遍可用的技术的功能,仅有提示语并不能提供足够的控制。
【译者按:注意,中国首例AI文生图案所涉的是“仅有提示语”的情况。】
(6)人类作者有权对其(具有)作者身份的作品享有版权,这种作者身份既是在AI生成输出中可感知的,也是在AI生成输出的材料的创造性选择、协调或编排中可感知的,或者是在AI生成输出的创造性修改中可感知的。
(7)尚未出现(需要)为AI生成内容提供额外的版权保护或自成一类的保护的案例。
美国版权局将继续监测技术和法律的发展,以确定是否应重新审视这些结论。它还将为公众提供持续的援助,包括通过额外的注册指导和对《美国版权局惯例汇编》的更新。”
3. 美国版权局最新报告与本文主题相关的内容
基于本文主题,这里重点关注美国版权局最新报告中与中国首例AI文生图案的研讨相关的内容。当然,由于该案只涉及提示语输入而不涉及对生成式AI模型的其他形式的输入,所以,本文也重点关注美国版权局最新报告中与提示语相关的内容。
3.1 美国版权局最新报告提及中国首例AI文生图案
美国版权局最新报告在第三节“国际的方法”中有一段话提到了中国首例AI文生图案,但未加评论。译文如下:
“在中华人民共和国,北京互联网法院评估了2023年涉及AI生成作品的版权侵权案件中的论点,从人类作者身份是版权保护必需的前提开始。它发现,使用Stable Diffusion创建的图像受中国版权法保护,使用AI创建图像的人是作者。根据法院的说法,150多个提示语的选择,结合后续的调整和修改,表明该图像是作者“智力成果”的结果,反映了他的个性化表达。”
该报告除了在该段话及其注释中提到中国之外,其他各处没有提到中国。
3.2 笔者在《一论》中的学术观点简述:
为方便讨论,现将《一论》中与本文直接相关的学术观点择要汇集如下。这些观点是基于创意/表达两分法的可预测性、确定性、可解释性(可简称为“两分法的三性”)的关于AIGC的可数无穷集理论,简称为“可数无穷集理论”。
——人类通过大语言模型(LLMs)的用户接口操作运行LLMs,就是人类(以输入提示语、选择各种风格等方式)输入创意但却无法预测输出的表达的过程。在已经得到第一次的输出表达的基础上,如果第二次输入创意的微调、得到第二次的输出表达,则仍然是人类输入创意但却无法预测输出的表达;这个微调过程可以持续、不断细化。在这个持续过程中,输出表达与输入创意之间的可预测性、确定性、可解释性关系,在第一次得到输出表达时就已经不成立;在第二次对上一次得到的输出表达进行输入创意的微调时仍然不成立;从第三次到第N次,总是对上一次得到的输出表达进行输入创意的微调,如此持续进行微调,每一次都还是不成立。
——从LLMs操作者的输入到LLMs的输出,AIGC对应的是一个由(对应于无穷多种“表达”可能性的)无穷多个元素组成的、其中元素是可数的“特定集合”。这是一种可数无穷集。该“特定集合”的“特定性”是由操作者所给出的提示语限定的。
——操作者对提示语的每一次输入或者微调,对应的AIGC都是一个(对应于无穷多种“表达”可能性的)可数无穷集。
——AIGC所对应的并不是该“特定集合”中(对应于某种具体“表达”的)某个特定元素。即使操作者进行提示词的x次微调,AIGC每一次所对应的都是一个(对应于无穷多种“表达”可能性的)可数无穷集,而不是该可数无穷集中(对应于某种具体“表达”的)某个特定元素。但是,适用于自然人创作作品的创意/表达两分法原则本来应该是由创意对应于“特定集合”中的具体某个元素。
——对于AIGC,从人类给出的创意(即多模态输入)到AI系统给出的表达(即多模态输出),创意/表达关系都具有不可预测性、不确定性、不可解释性,无法体现本来适用于自然人的创意/表达两分法的可预测性、确定性、可解释性,因此,本来适用于自然人的创意/表达两分法在AIGC情况下并不成立。因为创意/表达两分法的成立是可版权性成立的前提条件,所以,AIGC并不具有可版权性,人类对其通过LLMs用户接口进行操作(即给出创意)后运行所得的结果(即所得的表达)就不能享有版权。
3.3 美国版权局最新报告与本文主题相关内容译评
依照原文在美国版权局最新报告中与本文主题相关的内容所出现的先后顺序,给出译文如下。原文中连续的段落,在译文中放在同一个序号之内。笔者对美国版权局最新报告内容的评论,在相应段落的译文之后以“译者按”的形式给出。“译者注”则是对译文内容的技术性的注释。
(1)“对于使用AI创作的作品,就像那些没有使用AI的作品一样,确定可版权性需要对作品及其创作环境进行特定事实的考虑。如果AI只是在创作过程中帮助作者,那么它的使用并不改变输出的可版权性。在另一个极端,如果内容完全由AI生成,则其无法受到版权保护。9这些边界之间,产生AI输出可能涉及各种形式和组合的人类贡献。”
“虽然在评估可版权性方面几乎没有明确的规则,但本报告的这一部分旨在进一步阐明相关考虑因素。”
(2)“当今许多公开可用的AI系统允许从一个或多个输入(如文本、图像、音频、视频或媒体组合)生成输出。“提示语”是一种常见的输入类型,通常以文本的形式,传达输出的所需特征。AI系统通过以请求的格式(文本、图像、音频、视频)生成输出来响应这些输入。提示语往往描述用户试图唤起的话题、主旨和/或主题,可能包括整体风格、基调和/或视觉技巧。有些简短明了,比如要求“卡通宇宙飞船”。其他则更详细,要求一系列元素。用户可以一次性或迭代地输入提示语,对其进行细化,直到系统生成一个可接受的输出。”
(3)“美国版权局同意,将AI用作辅助创作作品的工具与将AI作为人类创造力的替代品之间存在重要区别。虽然增强人类表达的辅助使用并不会限制版权保护,但是AI系统做出有表达力的选择的使用情况则需要进一步分析。这种区别取决于如何使用AI系统,而不是AI系统的固有特性。”
【译者按:中国首例AI文生图案涉及的正是“将AI作为人类创造力的替代品”的情况、而不是“将AI用作辅助创作作品的工具”的情况。】
(4)“一些评论者将AI系统描述为黑箱,这意味着用户不仅在大多数情况下并不知道“AI对提示语的反应 ”是什么,而且即使是AI系统的开发人员通常也无法预测输出或解释为什么它们包含某些元素而不包含其他元素。一些人提供了包含用户想法详细描述的提示语的示例,其中输出省略了一些请求的元素并插入了其他元素。”
【译者按:这里的描述过于粗略。笔者在《一论》和《四论》中已经对基于AI的三种不同技术路线的三种“单纯”情况和四种“混合”情况进行了更加细分的讨论。此处不再赘述。】
(5)“一些人强调,无论提示语被使用多少次,生成式AI系统对同一提示语可以产生看似无限的变化。Kernochan 中心认为,“将书面提示语中的版权保护范围扩大到涵盖AI系统可能生成的多种潜在输出”,“不幸地与对生成图像(或其他作品)的方法授予版权非常接近”,这将在(美国版权法)第 102(b)条下被禁止。”
【译者按:这里所说的“生成式AI系统对同一提示语可以产生看似无限的变化”和“多种潜在输出”与笔者的可数无穷集理论可谓异曲同工。这里的观点值得注意——如果将对操作者输入的“书面提示语的版权保护范围”扩大到“涵盖AI系统可能生成的多种潜在输出”,那么,就非常接近于要对生成图像(或其他作品)的方法(method of generating images (or other works))授予版权,因而就会不幸地落入美国版权法第 102(b)条下禁止授予版权的“idea, procedure, process, system, method of operation, concept, principle, or discovery”的范围之内。】
(6)“一些评论者提出了“采收式作者身份”理论(尽管很少有人使用这个短语)。他们建议用户在决定接受生成式AI系统产生的输出时可以进行创造性判断。有人认为,“反复输入提示语,直到输出与他们想要的表情相匹配”的用户与“持续在画布上轻拍油漆,直到图像与画家的视觉相匹配的艺术家”没有什么不同。与此不同,美国作家协会将重复提示语比作“旋转具有无限可能性的轮盘赌轮子。”它认为,“当用户(隐喻地)旋转轮子几十次,直到落在所喜欢的输出上时”,这种活动不应该赋予用户对该输出主张所有权的权利。”
【译者按:美国作家协会的观点与笔者的可数无穷集理论是如出一辙。】
关于“采收式作者身份”理论,原注如下(限于篇幅,此处已删去其中涉及引文出处的文字):“这一理论认为,在创作作品的过程中,决定采用一些计划外或意料之外的东西,这就是作者身份。它可以追溯到 Alfred Bell & Co. v. Catalda Fine Arts 案,该案评估了基于公有领域绘画的铜版美柔汀【紧接下一行继续】
【译者注:Mezzotint engravings(铜版美柔汀)是一种独特的铜版印刷技术】的原创性。被告辩称,这些雕刻只是对已有绘画的复制,因此不受版权保护。法院认为雕刻师的版本有足够的差异,并推测“临摹者视力不佳或肌肉有缺陷,或雷声造成的震动,都可能产生足够明显的差异。”法院认为,“‘作者’在无意中发现了这种变化,就可以将其作为自己的作品并进行版权保护”。”
【译者按:该案法院的观点与笔者在教学中讲解“临摹不等于复制”时的表述别无二致——临摹技艺高超,到惟妙惟肖程度,就是复制,临摹者不享有版权;临摹技艺一般,到似像非像程度,就是改编,临摹者享有改编作品的(受原作品版权限制的)版权;临摹技艺差劲,到看不出原作品痕迹的程度,就是原创,临摹者享有新作品的不受限制的版权。】
“在讨论“采收式作者身份”的理论时,简·金斯伯格教授和卢克·阿里·布迪亚乔教授得出结论:“如果执行后采用来代替任何作者参与(即使是间接的或无意的)为作品赋予有形的形式(physical form),那么,除了 [命名]‘错误的’作者外,版权法还将对采用者有效地赋予对创意(idea)的权利。”丹尼尔·热尔韦教授用以下类比提出了类似的观点:“如果我因为在寻找一个特定的想法(比如,日落时的大象,远处有树)而走进一家专门销售非洲草原绘画或图片的画廊或商店,我可能会找到一幅符合我想法的绘画或图片,”但是“这决不能使我成为(这幅画的)作者。””
【译者按:这里的三位教授的观点与笔者的可数无穷集理论是殊途同归。】
(7)美国版权局的结论是,鉴于当前普遍可用的技术,仅靠提示语并不能提供足够的人类控制来使AI系统的用户成为其输出的作者。提示语本质上是传达不受保护的创意的指令。高度详细的提示语虽然可能包含用户期望的有表达力的元素,但是目前它们并不控制AI系统在生成输出时如何处理这些提示语。
【译者按:①这一段话是从2023年 8月开始征求公众意见近一年半后美国版权局在2025年1月得出的结论。
——“鉴于当前普遍可用的技术,仅靠提示语并不能提供足够的人类控制来使AI系统的用户成为其输出的作者。”
这就意味着,在中国首例AI文生图案判决时的2023年11月,鉴于“当时”普遍可用的技术,仅靠提示语“当然”并不能提供足够的人类控制来使AI系统的用户成为其输出的作者。换言之,该案原告并不能成为由生成式AI系统生成的系争图片的作者。
——“提示语本质上是传达不受保护的创意的指令。高度详细的提示语虽然可能包含用户期望的有表达力的元素,但是目前它们并不控制AI系统在生成输出时如何处理这些提示语。”
这里针对的就是AI的连接主义技术路线情况,具体说就是前述“基于AI的三种不同技术路线的三种单纯情况和四种混合情况”中的四种涉及连接主义的系统:一是单纯的连接主义系统,二是连接主义、符号主义两者相结合的“第一种混合系统”,三是连接主义、行为主义两者相结合的“第二种混合系统”,四是连接主义、符号主义、行为主义三者相结合的“第四种混合系统”。
注意,与此形成对照的是,在传统的AI系统情形,也就是单纯的符号主义系统情形,输入的指令集是可以全程控制计算机系统产生按照既定算法应该正常输出的内容的。在这一方面,《一论》中提到的四色定理证明过程就是一个经典示例。
②另一方面,在美国版权局最新报告的“执行摘要”部分给出的结论和建议中的第(3)项和第(5)项,结合起来也表达了类似的观点。第(3)项指出,“版权并不延及纯粹的AI生成材料,也不延及人类对有表达力的元素控制不足情况下的材料。”第(5)项指出,“基于当前普遍可用的技术的功能,仅有提示语并不能提供足够的控制。”事实上,中国首例AI文生图案涉及的正是“仅有提示语并不能(对有表达力的元素的)提供足够的控制”的情况,因此,版权并不延及该案中“人类对有表达力的元素控制不足情况下的材料”。】
关于共同的作者身份的案例支持这一结论。这些案例解决了主张作者身份所需的控制程度。提供详细的指示,而不影响这些指示的执行方式,是不够的。正如第三巡回法院所解释的那样,当一个人雇佣某人来执行他们的表达时,为了委托人能够主张在最终作品中的版权作者身份,“这个过程必须是并不需要智力修改或高度技术性的增强的死记硬背或机械转录”。虽然在生成式AI系统中输入提示语可以被视为类似于向受委托创作作品的艺术家提供指令,但是存在着关键的区别。在人与人合作的情形,雇佣方可以监督、指导和理解(oversee, direct, and understand)受委托的人类艺术家的贡献。根据每一方贡献的性质,艺术家可以是唯一作者,或者成果可以是合作作品或雇佣作品。理论上,AI系统有朝一日可能会允许用户对他们的表达如何反映在(系统的)输出中施加如此多的控制、以至系统的贡献将变成死记硬背或者机械的。关于当今的AI系统运行的证据表明,当前情况并非如此。提示语既不能显示出充分决定所产生的有表达力的元素(expressive elements),也不能显示出控制系统如何将其转换为输出。
【译者按:这里讲到,涉及共同的作者身份的案例显示,如果仅仅是提供详细的指示、而不影响这些指示的执行方式,对于主张作者身份所要求的控制程度而言是不够的。相关法院认为,只有当受委托人只是在死记硬背或机械转录、而不需要智力修改或高度技术性的增强时,委托人才能主张其在最终作品中的版权作者身份。“在人与人合作的情形,雇佣方可以监督、指导和理解受委托的人类艺术家的贡献。”这种情况下,委托人面对的是受委托人——人类行为体(human agent)。而在人类给生成式AI系统输入提示语的情况下,人类操作者面对的是软件行为体(software agent),操作者事实上无法“监督、指导和理解”包括软件行为体在内的AI行为体(AI agent)。这是由AI的连接主义技术路线的性质即不可解释性所决定的。
当人类(委托人)面对的行为体由人类行为体(受委托人)转变为软件行为体时,这两种情况的差别在于:如果成果是人类行为体(受委托人)撰写的,则根据每一方贡献的性质,人类行为体(受委托人)可以是唯一作者,或者成果可以是合作作品或雇佣作品。如果成果(即AI系统的输出)是软件行为体运行的结果,那么软件行为体因尚不具备法律主体资格而无法成为版权人。但在后面这种情况下,因为当前生成式AI系统的输出并不是对输入提示语的“死记硬背或机械转录”,所以人类操作者不能主张对输出的版权作者身份。
在AI的连接主义技术路线情形,如果有朝一日系统允许用户对其表达如何反映在系统的输出中施加如此多的控制、以至系统“变成死记硬背或者机械的”时候,操作者就可以成为系统输出的版权人。
在AI的符号主义技术路线情形,具体说就是前述“基于AI的三种不同技术路线的三种单纯情况和四种混合情况”中的两种涉及符号主义的系统情形,本来人类就可以成为系统生成内容的版权人:一是单纯的符号主义系统情形;二是符号主义、行为主义两者相结合的“第三种混合系统”情形。正如笔者在《一论》和《四论》中已经阐述的那样。
关于“有表达力的元素”(expressive elements)相关问题,由于篇幅限制,本文不作探讨。】
提示语和结果输出之间的差距表明,用户对其创意转换为固定的表达(的过程)缺乏控制,是系统在很大程度上负责确定输出中的有表达力的元素。换句话说,提示语可能反映用户的心理概念或创意,但它们并不控制表达创意被表达的方式。在内部修改或重写提示语的生成式AI系统的情况下,这一点更为明显。这一过程将人类的贡献(无论人类的贡献可能多么详细)重塑成一种不同的形式。
【译者按:这一段话是在上一段话基础上,进一步论证美国版权局此前的结论。】
(8)相同的提示语可以生成多个不同的输出,这一事实进一步表明缺乏人为控制。正如一个流行的系统在其网站上解释的那样,“无论多么详细⋯⋯同一文本描述了无数可能的”输出。在这些情况,AI系统的黑箱对用户的指示提供了不同的解读。
【译者按:“相同的提示语可以生成多个不同的输出”,这是最接近于笔者的可数无穷集理论的表述。也就是说,在给出创意(输入提示语)之后,操作者只是在机器可以提供的表达(输出结果)的可数无穷集中选择了某个元素;并不是操作者的创意直接指向了可数无穷集中的某个元素作为表达。】
反复修改提示语不会改变这一分析,也不会为主张输出的版权提供足够的依据。首先,通过修改提示语来创作作品所涉及的时间、开支或努力是无关紧要的,因为版权保护的是原创的作者身份,而不是辛勤工作或“额头的汗水”。其次,输入一条修改后的提示语在操作上似乎与输入单个提示语没有实质性区别。通过多次修改和提交提示语,用户正在“重新滚动”骰子,导致系统生成更多可供选择的输出,但不会改变对过程的控制程度。无论提示语被修改和重新提交多少次,最终输出都反映了用户对AI系统解释的接受程度,而不是它所包含的表达的作者身份。
【译者按:这里关于操作者“反复修改提示语”的法律效果的论证,与笔者在可数无穷集理论中的论证是异途同归。笔者的论证思路是:即使操作者反复修改提示语,AIGC每一次所对应的都是一个可数无穷集,而不是该可数无穷集中某个特定元素。因此,创意/表达两分法在AIGC情况下并不成立,从而导致AIGC并不具有可版权性,人类对其操作所得的结果就不能享有版权。这里的论证思路是:操作者反复修改提示语,就是“重新滚动”骰子,只能导致系统生成更多可供选择的输出,但不会改变对过程的控制程度。无论反复修改提示语多少次,最终输出都只是反映用户对AI系统解释的接受程度,而不是它所包含的表达的作者身份。因此,操作者仍然不能享有输出的版权。】
(9)美国版权局还同意,采收式作者身份本身并不能为主张AI生成输出的版权提供依据。正如评论者所指出的那样,向机器提供指令并选择一个输出并不等于作者身份。在不受控制的选项中选择一个AI生成输出更类似于策划一个“活花园”,而不是应用泼洒的油漆。(原注:认为版权保护的“关键”是“人类对争议作品的参与和最终的创造性的控制”。)正如 Kernochan 中心所观察到的那样,这种系统产生的“在所提供的选项中进行选择”不能被视为可版权的作者身份,因为“选择单个输出本身并不是一种创造性的行为”。
【译者按:如果用笔者的可数无穷集理论来表述上述观点,就是:在给出创意(输入提示语)之后,操作者只是在机器自行提供的表达(输出结果)的可数无穷集中选择了某一个元素;并不是操作者的创意直接指向了可数无穷集中的某一个元素作为表达。】
也许有一天,提示语能够充分控制在AI生成输出中的有表达力的元素,以反映人类的作者身份。如果技术的进一步推进为用户提供了对这些有表达力的元素的更多控制,那么就可能会得出不同的结论。另一方面,促进自动化和最优化的技术进步可能会加强我们目前的结论。例如,如果生成式AI系统集成或者进一步改进了自动提示语的最优化,用户的控制可能会减弱。
【译者按:美国版权局最新报告对未来的提示语能否提供足够的人类控制来使AI系统的用户成为其输出的作者这个问题的前景进行了开放的预测:一种是能够;另一种是不能。对此,我们可以拭目以待。】
(10)根据版权的基本原则、快速发展的技术现状以及收到的对调查通知的答复信息,美国版权局得出结论认为,就解决可版权性的问题而言,现有的法律原则是胜任的和合适的。版权法早已适应了新技术的发展,可以逐个案件来确定AI生成的输出是否反映了足够的人类贡献,以便为版权保护提供正当理由。如上所述,在许多情况下,如果AI是被用作工具,并且人已经能够决定这些输出所包含的有表达力的元素,那么这些输出的或者全部或者部分将是可版权的。然而,在现阶段,仅靠提示语是不太可能满足这些要求的。美国版权局将继续监测技术和法律的发展,以评估是否需要采取不同的方法。
【译者按:这是美国版权局最新报告的第五节“结论”中与本文主题相关的一段话。注意,加了下划线的文字是与中国首例AI文生图案直接相关的。
如前所述,单纯的符号主义系统和符号主义、行为主义两者相结合的“第三种混合系统”,就是“AI是被用作工具,并且人已经能够决定这些输出所包含的有表达力的元素”的情形。】
四、结语
美国版权局最新报告关于“鉴于当前普遍可用的技术,仅靠提示语并不能提供足够的人类控制来使AI系统的用户成为其输出的作者”的结论佐证了笔者从《一论》到《四论》对中国首例AI文生图案判决的结论,即该案裁判思路有误,应当提起再审。
本文是对美国版权局最新报告中的基本观点尤其是与提示语相关内容的初步研究,该报告的其他内容同样值得深入研究。
作者:寿步
编辑:Sharon
来源:知产前沿