科技巨头苹果遭作家起诉，AI 模型涉嫌盗用版权书籍训练

摘要：据香港IDC新天域互联了解，继 Anthropic 达成 15 亿美元版权和解后，苹果公司因 AI 训练数据合规问题再度引发关注。美国作家格雷迪・亨德里克斯（Grady Hendrix）与詹妮弗・罗伯逊（Jennifer Roberson）日前向加州北区联邦法

据香港IDC新天域互联了解，继 Anthropic 达成 15 亿美元版权和解后，苹果公司因 AI 训练数据合规问题再度引发关注。美国作家格雷迪・亨德里克斯（Grady Hendrix）与詹妮弗・罗伯逊（Jennifer Roberson）日前向加州北区联邦法院提起诉讼，指控苹果使用包含其著作的盗版数据集 Books3 训练 OpenELM 模型，且未获授权或支付费用。

诉讼文件显示，原告著作被纳入苹果训练数据集的关键证据，来自苹果公开的 OpenELM 模型论文。文中提及的 Books3 数据集包含 19.6 万本盗版书籍，主要源自盗版资源站 Bibliotik，曾被 Meta 等多家科技企业用于 AI 训练，最终在 2023 年因丹麦反盗版组织 Rights Alliance 提交 DMCA 请求而下架。原告律师指出，苹果网络爬虫技术通过 "影子图书馆" 获取这些受版权保护的内容，其 AI 模型产出的商业化内容已与原创作品形成市场竞争。

此次诉讼已申请集体诉讼资格，原告方强调 Books3 数据集涉及的海量作品规模，可能使案件演变为行业代表性诉讼。值得注意的是，Anthropic 去年因使用同类数据集训练 Claude 模型被诉，最终以 15 亿美元达成和解 —— 按每部涉案作品 3000 美元计算，50 余万作者将获得赔偿。该和解案创下版权诉讼史纪录，其赔偿标准或成为苹果案的重要参考。

作为以隐私保护为品牌标签的科技巨头，苹果此次面临的声誉风险尤为突出。行业分析师指出，若法院认定其系统性使用盗版数据，除可能面临数亿美元赔偿外，正在推进的 Apple Intelligence 战略将遭遇信任危机。消费者难以接受标榜数据合规的企业，在 AI 技术底层依赖非法获取的训练资源，这种品牌形象与商业行为的矛盾或引发用户信任崩塌。

案件核心争议仍围绕 AI 训练的法律定性：原告方认为，商业机构未经授权使用完整版权作品进行营利性技术开发，已超出 "合理使用" 范畴；而科技公司常以 "数据合成未直接复制原内容" 作为抗辩理由。随着欧盟《人工智能法案》即将实施，美国多州加速制定 AI 数据合规标准，此类诉讼正推动全球司法界重新界定技术创新与版权保护的边界。

对 AI 行业而言，训练数据的合规性已从道德争议升级为生存命题。当生成式 AI 进入规模化商用阶段，建立透明的授权机制成为破局关键。此次苹果诉讼不仅是企业个体的法律纠纷，更折射出整个产业在知识产权保护与技术创新间的深层矛盾，其判决结果或将重塑 AI 训练数据的行业规则。

来源：小温说科技

标签：苹果模型版权 ai模型书籍

本文地址：http://news.43b.com.cn/a/1038805.html

免责声明：本站系转载，并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题，请在30日内与本站联系，我们将在第一时间删除内容!