摘要:1999年,王蒙、刘震云等六位知名作家起诉“世纪互联”公司侵犯其著作权;2015年,今日头条、一点资讯等新兴聚合类资讯App被以《新京报》为代表的新闻媒体机构维权;自去年至今,AI大模型爆发,国内AI声音、AI图片、AI视频侵权案涌现,在大洋彼岸的北美,Ope
本报记者 曲忠芳 北京报道
1999年,王蒙、刘震云等六位知名作家起诉“世纪互联”公司侵犯其著作权;2015年,今日头条、一点资讯等新兴聚合类资讯App被以《新京报》为代表的新闻媒体机构维权;自去年至今,AI大模型爆发,国内AI声音、AI图片、AI视频侵权案涌现,在大洋彼岸的北美,OpenAI、Anthropic等AI(人工智能)大模型公司成为知识产权领域诉讼的新“常客”。
知识产权作为市场经济的产儿,与技术发展紧密相关,每个时代都有新的课题。相比互联网、移动互联网兴起之初的著作权纠纷与版权侵权案件,当下随着AI大模型、生成式AI的飞速发展,内容生成、信息处理、数据挖掘等应用日益广泛,知识产权保护在商业实践及司法实践中显然更具挑战性。
AI生成内容算不算作品?“站在巨人肩膀上”通过AI进行创作的产物是否具有著作权?AI生成内容面临的知识产权保护为什么挑战更大?针对这些产业界关注的问题,《中国经营报》记者做了相关调研和采访。
AI生成版权纠纷全球密集涌现
11月29日,包括《多伦多星报》《环球邮报》、加拿大通讯社等加拿大多家主流媒体,向加拿大安大略省高等法院提起对OpenAI的诉讼,指控OpenAI“经常违反”版权和在线使用条款,从加拿大媒体上抓取大量内容,用以开发其以ChatGPT为代表的产品。这一过程中OpenAI并未获得内容所有者的许可或对此作出补偿,却利用这些内容从中获利,他们要求法院判令OpenAI作出惩罚性赔偿,对其使用的每篇新闻报道赔偿最高2万加元(1加元约5.15元人民币),诉讼总额达数十亿加元。对此,OpenAI方面发表声明称,该公司的“模型以公开数据为基础,以公平使用和相关国际版权原则为依据,对创作者是公平的,并支持创新”。
在此之前,OpenAI已是多起版权诉讼案的“被告”,最为知名的是《纽约时报》起诉OpenAI一案。2023年12月底,《纽约时报》向曼哈顿联邦法院提起诉讼,指控OpenAI和微软未经授权使用该媒体数以百万计文章训练ChatGPT之类的AI机器人,要求停止使用其内容训练的AI模型并销毁数据。《纽约时报》认为,该报社每年付出的人力成本达上亿美元,加上其他投入,“被告未经许可,也未给予补偿就占用了这些成果,从而避免了数十亿美元的投入,也就给《纽约时报》造成了巨大的损失”。截至目前,该起诉讼仍在进行中。OpenAI寻求与《纽约时报》就版权问题进行“建设性谈判”,双方之间的拉锯仍然未达成共识。
除了OpenAI,Anthropic、Perplexity等其他AI明星公司同样也面临诉讼。10月21日,新闻集团旗下道琼斯和《纽约邮件》对AI搜索公司Perplexity提起诉讼,称后者“大量非法复制”其版权作品。
在欧洲,德国汉堡地区法院于9月27日就摄影师Robert Kneschke起诉非营利机构LAION一案作出判决,驳回了原告的诉讼请求。本案是在世界范围内,著作权人起诉数据集创建者侵权的第一个判决,同时也是欧盟《人工智能法案》(AI Act)在今年8月生效(两年后实施)后的第一案。
而在中国地区,2023年11月,北京互联网法院审理判决了“文生图著作权侵权第一案”,原告使用开源软件Stable Diffusion,通过输入提示词生成了涉案图片并发布在社交媒体上,被告未经许可使用且截去署名水印;2024年4月11日,国内首例AI视频侵权案正式立案,并于5月中旬首次开庭审理,《山海奇境》预告片原创者作为原告,指控被告未经授权使用AI技术复制并公开发布了与原告作品极为相似的侵权视频;随后在4月23日,北京互联网法院对全国首例“AI声音侵权案”进行了一审宣判,认定被告五家公司未经合法授权使用原告声音开发AI文本转语音产品,构成了侵权,赔偿25万元。
记者注意到,与AI大模型、AI生成技术相关的版权纠纷在全球范围内普遍出现,涉案产品覆盖了AI生成的文字、图片、声音、视频等多形态,诉讼主体涵盖新闻机构、摄影师、配音师、艺术家、作家等不同身份。无论是已有判决结果的,还是尚在审理中的,关键性的法律焦点之一是,使用AI生成的内容是否是“独创性智力投入”,如果是,那么相关著作权一般归属于AI使用者;另一个关注焦点在于人工智能预训练需要高质量的数据,如专业新闻、学术论文、高质量代码、图书、经典作品等,高质量数据面临授权难的困境。
AI生成作品的知识产权保护问题
一般来说,著作权保护的基本原则是“事前授权,有偿使用”。北京大学法学院教授张平在《人工智能生成内容著作权合法性的制度难题及其解决路径》一文中指出:“基于数据训练投喂以形成更加成熟的大模型训练效果已成为当下人工智能技术升级与模式迭代的必由路径,然而人工智能训练数据的路径不仅与现有法律秩序存在冲突,而且极大地影响了原有商业模式,冲击人们对于作品交易、数据喂养的既有认识和观念。”
在张平看来,人工智能训练数据的著作权合法性障碍具体表现为:占据著作权许可使用模式的主流方法“事前授权”式使用付费模式已难以满足海量学习模式的需求,人工智能机器学习在内容获取、内容输入与输出全阶段存在著作权侵权风险,多样化、复杂化的数据保护利益与仅进行著作权合规的不完整性之间存在矛盾。
北京高勤律师事务所律师王源指出,目前关于AI著作权的判定尚未形成主流的评判标准,从国内外的判决结果来看仍是基于传统著作权框架内的评判标准,涉及创作者是谁、AI作品是否享有著作权、是否能在别人创作的作品上再次创作等问题。谈及AI版权纠纷与此前互联网时代、移动互联网时代的诉讼案件有何不同,王源认为,AI版权纠纷需要判定机器行为如何认定、机器作品有没有创造性的问题,这与以往有本质不同。
值得一提的是,北京互联网法院在审理判决“AI文生图著作权侵权第一案”时指出,涉案图片的生成过程涉及原告的独创性智力投入,包括设计人物呈现方式、选择提示词、设置参数等,体现了原告的智力投入,具备“智力成果”要件,且具备“独创性”要件,因此被认定为作品,受到著作权法保护。
北京盈利律师事务所律师曲虹潭向记者解释:“讨论著作权的前提是,要判断是否构成作品。在司法实践中,我们要考虑这几个要点,如是否在文学、艺术和科学领域内,是否有独创性,是否有一定的表现形式,是否属于智力成果。并非所有的AI生产物,都满足上述四个要点而成为作品,有的可能没有融入作者独特的设计、编排等智力劳动,有的可能不属于特定的领域,因此应当结合个案作具体研判。‘AI生成’这个行为,有点类似于‘站在巨人的肩膀上起舞’,海量的数据是AI生成物的基础和依托。但举个极端的例子,如果AI生成了一个与其数据库中构成实质性相似的‘内容’,那该AI生成物被认定为作品的可能性便大幅降低。此外,AI模型并非自然人,并不是法律上的适格主体,但AI模型背后的使用者,其实还是人。在符合一定条件下,利用AI生成图片的著作权,一般是归属于利用AI软件的使用者。”
曲虹潭指出,技术的进步,一定会带来新变化,而法律也需要不断地去调整。在相机、手机等工具诞生之前,人们可能需要通过学习绘画的技艺,才能绘出属于自己的作品。而在AI生成时代,我们只需要告诉AI模型我们想要什么。举个简单的例子,当一个人用摄影机拍摄了一部精美的影片,其著作权自然不属于摄影机。而那时的摄影机,是否就类似今天的AI大模型呢?这些其实都是工具,也就是所谓的“术”的层面,并非“道”的层面。因此,AI时代的版权纠纷会面临一些新的挑战,比如判断使用人是否投入了独创性的设计、编排等智慧劳动?还是“照猫画虎”抄袭了别人的一系列参数?但这些都只是表面,由表及里,其底层逻辑实际上是一以贯之的。
来源:中国经营报