AIGC系列回顾与更新（71）

摘要：原告崔某在”即梦图片生成“软件中输入一段文字，一键生成图片并在个人社交账号上发表。因某公司未经许可在公众号中使用该图片，诉至法院，请求法院判令被告停止侵权并赔偿损失。

鹰潭中院今年知产日发布了一个涉及AIGC作品认定的典型案例。

原告崔某在”即梦图片生成“软件中输入一段文字，一键生成图片并在个人社交账号上发表。因某公司未经许可在公众号中使用该图片，诉至法院，请求法院判令被告停止侵权并赔偿损失。

法院认为涉案图片虽然从图片本身看属于由色彩、线条构成的，具有一定审美意义的平面艺术作品，但基于以下分析，不应认定构成作品：

原告在创作过程中高度依赖AI软件的技术功能，仅通过语言描述，未进行过手动修改和参数调整，没有付出与传统创作图片相称的智力性劳动；（原告在诉讼中称其为对图片进行手动修改或调整，输入同样关键词生成的图片各不相同。）相同的语言通过“一键生成”的图片却各不相同，可知图片生成大多由软件开发者的设计和大数据应用完成，具有很大的随机性；案涉图片缺少作者的独创性表达，与作者自主创作的图片具有本质区别。

法院最终驳回原告诉讼请求。该案入选典型案例的原因在于，法院对AI生成内容进行作品属性认定时进行审慎考虑，对大数据算法和模型、工具使用者的智力性劳动对“表达”的作用进行审查，对大数据算法和模型生成特性进行审查。

法院发布案例时还特别提示广大公众在使用网络上的图片时要谨慎识别是否能够用于商业用途，通过合法方式使用该类图片，摒弃“拿来主义”，提高知识产权保护意识。

可惜判决还没上网，只能先看一下案例简介。

参考：2025年4月25日江西省鹰潭市中级人民法院公众号发布的《「知识产权宣传周」鹰潭中院、月湖法院联合发布知识产权典型案例》（案例4:“AI软件生成图片著作权权属、侵权纠纷案——崔某诉某文化公司侵害作品信息网络传播权纠纷。一审：江西省鹰潭市月湖区人民法院（2025）赣0602知民初47号）

今年4月发布的配音员诉AI语音大模型侵权案（成都），可以对照去年4月北互宣判的全国首例AI生成声音人格权侵权案来看。两案审查方法和法律依据相同，成都案原告未获支持的关键原因是证据不足——“……在未见到附有原告肖像的视频情形下，通过聆听’孟帅’的多个声音文件并不能使一般大众将该声音与原告产生联系，也不能达到通过该声音即可识别出声音的主体为原告的程度……在案证据无法证明被告存在侵害原告声音权益的行为”。

简单看一下案情。

原告是一名资深配音员，自2019年10月开始从事配音工作并通过配音获得收入，为《青岛保密局》等多部作品录制配音。

被告是“超级配音”APP的开发者和运营者。该软件主要向注册用户提供配音制作、分享等服务，用户充值、付费之后可获取该软件上的配音、音乐等内容。根据软件页面显示，软件内涉及配音大量用于商品、餐饮等各类销售或是服务的促销等“叫卖”宣传内容，软件内配音音源系通过人声和AI生成等方式形成。

2023年3月，原告发现被告APP中有一个名为“孟帅”的虚拟配音包，配音包的声音与原告具有高度相似性。原告认为被告APP未经原告许可，以AI技术“克隆”其声音的行为已经构成侵权：

原告在被告APP中购买“孟帅”配音包后，将配音包配音与原告为蘑菇白沙岛广告、促销广告、基金服广告、星空露营广告的配音进行分析比对，比对结果显示相似度分别为88.32%、90.66%、90.93%、95.35%，构成高度相似；被告以“孟帅”这一角色提供文字转语音服务获利；该音频已被众多第三方应用广泛传播使用，直接导致原告收入急剧下降；原告与被告多次沟通无果，且被告仍在将原告声音非法商用，严重损害原告声音权益。

被告辩称自己不构成侵权，从诉讼主体资格、商业模式合法性、声音权益构成要件等多角度进行答辩，主要涉及：

原告与本案无利害关系，没有任何证据表明原告与案涉配音包的声音存在关联，法院应当裁定驳回起诉；原告没有举证证明其声音具有显著特征，足以使得他人可以通过其声音识别其身份，故原告的声音不具有识别性，不满足声音权益保护的前提条件；案涉配音包声音是被告基于大模型（“某多维合成模型”）生成的声音，而非基于某个人的声音进行训练和输出；原告没有举证证明涉案配音包声音与原告自身声音一致，被告面向社会公众提供的配音包声音不会对原告声音产生混淆；原告不具有知名度，被告无模仿原告声音的客观需要，被告拥有先进的语音生成技术，能够快捷生成各种符合自身业务需求的声音，且被告开发支出巨大，当前阶段也无盈利；原告现有证据无法证明其损失。

其中，对于案涉配音包声音由AI大模型生成而非基于某个人的声音进行训练和输出，被告对技术原理和训练数据来源说明如下：

技术角度：

1）被告使用开源或者合法授权的声音进行模型训练，并生成多款可供用户使用的声音；用户可以通过对生成的声音参数进行调整，继而生成更多声音。也就是说，涉案APP中的声音并不是克隆某一个人的声音，而是通过先进的语音生成技术生成新的声音。

2）为证明其主张，被告提交语音生成技术原理说明、有关声音生成技术的文献及翻译作为证据。

训练数据来源：

1）被告主张生成语音所使用的素材具有合法来源；

2）为证明其主张，提交其作为乙方与用户（甲方）签订的多份《委托协议》和《声音授权书》）作为证据，协议约定“在本协议下，甲方委托乙方提供录音及录音制作服务，即乙方根据甲方提供的内容进行录制，并制作为录音制品”。

为证明原告举证不足以证明配音包声音与原告声音一致、社会公众不会对二者产生混淆，被告也提交了在同一平台上进行声纹比对的录像证据：

在该平台上传原告与原告自身多组配音进行对比，对比结果为同一人声音的概率分别为93.76%、87.12%、82.2%；在该平台进行男声、女声声纹比对，对比结果相似度为65.36%-63%、46%。

鉴于：1）双方在同一平台进行同类比对，结果有差异；2）被告举证显示通过该平台比对男声、女声声纹也会出现高达60%的相似度。法院最终判定该平台对声音比对的结果不能作为认定存在侵权事实的依据。

写到这里想起最近看的AI鉴定AI、AI检测工具争议相关的文章，感兴趣的话可以检索看看（比如《从算法解释到系统测评——人工智能法治的信息工具变革》）。

回到本案，法院最后采用社会一般标准对配音包声音是否可识别到原告身份进行判断，即“社会一般公众不采用其他技术手段或识别方式而仅仅通过聆听声音即可对应、联系至特定个人，则应当认定该声音具有身份识别性”，具体情况明天看。