法律大数据产品侵权案(3)

B站影视 内地电影 2025-03-24 19:23 1

摘要:成立于2015年的ROSS从事向公众提供法律研究服务的业务,最初在破产法和知识产权法领域提供研究服务,但目前已经在各种执业领域以及全美50个州提供案例法、法规和条例的检索服务。ROSS的用户可以通过用自然语言提出问题来搜索相关法律,而不是使用布尔逻辑术语或关键

原告从被告成立背景、使用目的、使用内容与获取方式等方面对被诉行为展开描述,内容大致是:

成立于2015年的ROSS从事向公众提供法律研究服务的业务,最初在破产法和知识产权法领域提供研究服务,但目前已经在各种执业领域以及全美50个州提供案例法、法规和条例的检索服务。ROSS的用户可以通过用自然语言提出问题来搜索相关法律,而不是使用布尔逻辑术语或关键词,与Westlaw类似,ROSS平台为用户提供了案例摘要和处理意见,并允许用户将初始搜索结果作为起点,进一步查找具有类似事实和/或程序立场的其他案例。为了创建一个能够与Westlaw竞争的法律研究平台,ROSS需要获取大量的法律内容、这些内容的描述以及一种组织这些法律内容的方式。ROSS知道它不会被授予出于这种目的使用Westlaw的权限,因此它选择通过欺骗性和未公开的手段获取Westlaw的访问权限——与第三方法律研究公司LegalEase合作,通过其获取基于Westlaw内容编写的“批量备忘录”(Bulk Memos),这些备忘录包含了法律问题和答案,可以直接用于训练ROSS的AI模型。然而,这种获取方式构成侵权,因为LegalEase与Westlaw的合同中明确禁止将内容用于此类目的。(从后续诉讼文件看,原告先起诉LegalEase侵权然后又撤诉,被告认为原告这样操作是为了获取与ROSS相关的证据,然后对ROSS发起诉讼。)

原告进一步对LegalEase违反许可规则行为进行说明:

LegalEase因为只提供研究和写作服务(而非像ROSS那样开发提供竞争性法律研究产品),自2008年起获得Westlaw有限许可,相关服务协议禁止LegalEase在原告的产品或网络上运行或安装任何计算机软件,禁止其向第三方批量销售、再许可、分发、展示、存储或传输Westlaw信息。LegalEase的Westlaw使用量在2017年7月前一直稳定在每月约6000次交易左右,但之后剧增,最终达到每月23.6万次交易——相比其历史使用量增加了近40倍,比“AmLaw100”律师事务所月均使用量高出近5倍。(诉状中“交易”是指任何执行的搜索,以及对特定文件的查看、打印、下载或发送操作。)LegalEase相关账户活动迹象表明其使用了计算机软件或爬虫,而且这些软件工具“似乎正在批量下载和存储”Westlaw内容。原告还观察到,LegalEase的软件正在系统地浏览WKNS,原告认为此举目的在于复制并存储WKNS的组织方式。原告认为LegalEase不但实施了上述严重违反服务协议的行为,还在ROSS指示下,非法复制并分发了受版权保护的Westlaw内容:1)在2017年7月的一次采访中——也就是LegalEase的Westlaw交易量开始急剧上升的时间——LegalEase表示正在与一家“机器学习法律研究公司”合作,帮助创建一种新的法律研究产品。这家机器学习公司后来被披露是ROSS。LegalEase称其正在向ROSS提供“大量法律研究。2)原告认为LegalEase向ROSS提供的内容源自Westlaw版权内容,ROSS向LegalEase支付费用,要求其从Westlaw复制内容以构建ROSS平台,属于明知故犯地指示LegalEase违反其与原告的服务协议。3)LegalEase和ROSS至少从2015年10月起就开始合作。2018年1月,原告因LegalEase严重违反服务协议而终止了与LegalEase的服务协议。

原告随后再次强调ROSS的平台算法在功能上类似于Westlaw算法,ROSS这样做的目的是可以节约包括创造力、才能、时间、努力和资金在内的大量资源投入。除非法院禁止,否则ROSS会继续侵权并从原告作品中获利,因此请求法院发布禁令,避免原告继续遭受不可弥补的损害。

这里可以结合一些背景信息来理解原告的逻辑。ROSS创始人接受采访时表示设立ROSS平台的初衷是法律费用高昂,希望通过技术手段降低法律服务门槛,让人人都能享受到优质且廉价的法律服务。

平台目标客户群体有两类,第一类是律师——希望通过引入AI技术,提高法律研究效率、减少律师在基础性工作上花费的时间和精力,进而降低法律服务的整体成本;第二类是终端用户——因成本过高而无法获得法律服务的群体。

实施目标上,ROSS设想是利用自然语言处理和机器学习技术,快速从海量法律文档中提取相关信息,给出答案。为了实现目标,它需要大量的法律文本数据来训练AI模型——这些数据不仅包括原始的法律判决书,还需要经过整理和注释的内容,以便机器学习算法能够更好地理解和处理法律语言。

此时,Westlaw就成为一个优质的训练数据目标来源——Westlaw作为全球知名的法律信息平台,拥有海量的法律判决、法规以及经过编辑的法律注释(如Headnotes和Key Number System),这些内容对于训练ROSS的AI模型具有极高的价值。

自行创建类似Westlaw的内容需要大量的时间和资源投入,获取Westlaw数据可以显著加快开发进度。在被拒绝许可后,ROSS采用的获取方式是通过Westlaw许可客户LegalEase获取数据。

回到诉状本身,原告主张ROSS通过LegalEase获取了约25,000份备忘录(Memos),这些备忘录通常是对特定法律问题的分析和解答,往往包括案件事实、法律规则、分析以及结论等内容。原告在诉状中写道:

LegalEase的律师根据Westlaw的法律批注整理出法律问题和答案,这些内容被组织成问答对形式(每份备忘录包含一个法律问题及其对应的四到六个答案),用于模型训练——LegalEase在生成备忘录时,明确要求律师不得直接复制粘贴Westlaw的法律批注。ROSS将这些备忘录转换为机器学习训练数据:1)文本转换:将备忘录中的法律词汇和问题答案转换为数值数据;2)训练AI模型:通过“特征化”工具对数据进行数学计算,训练AI模型以理解法律语言,从而能够识别语言模式并提供答案。

原告认为ROSS被诉行为已经构成版权直接侵权,并且应对LegalEase版权直接侵权行为承担连带责任。

ROSS辩称这种使用方式属于合理使用,因为属于转换性使用。但是法院后来在2025年2月判定这种使用方式并未赋予Westlaw法律批注以新的意义或目的,且用于商业用途,不属于合理使用。法院还认为被诉使用行为已经构成对Westlaw法律批注的直接复制,构成版权直接侵权。

除了版权直接侵权指控,原告还指控被告恶意干扰合同关系,因为ROSS知道LegalEase与West之间存在一个有效的合同却故意指示LegalEase违反该合同,且没有任何正当理由,这种故意且侵权性地合同干扰行为使原告遭受了损失。

“Tortious Interference with Contract”(“合同侵权干扰”或“恶意干扰合同关系”)是指故意且不正当地干预他人之间有效合同的履行,从而导致合同一方遭受损失的行为。构成要件包括:1)存在有效合同;2)干扰方知道存在该合同;3)干扰方的行为是故意的,旨在破坏或阻碍合同履行;4)损害结果;5)因果关系。

原告Thomson Reuters和West请求法院作出有利于原告、不利于被告ROSS的判决,具体如下:

认定ROSS直接和间接侵犯了原告在Westlaw中的版权;认定ROSS的版权侵权行为是故意的;认定ROSS恶意干扰了West与LegalEase之间的合同关系;认定除非被禁止,否则ROSS极有可能继续侵犯原告的版权;颁发初步和永久禁令,禁止ROSS及其代理人、雇员、律师、继承人和受让人,以及所有与之协同行动的个人、公司和企业,直接或间接侵犯原告的版权,包括但不限于提供ROSS的法律研究产品;命令ROSS移除并销毁其法律研究产品中的所有Westlaw内容;命令ROSS向Thomson Reuters和West提供一份完整的账目,说明ROSS因上述侵权行为所获得的所有利润、收益、优势以及由此获得的商业机会的价值;对原告因侵权行为所遭受的所有损失作出判决,并对ROSS因侵犯Thomson Reuters版权而获得的任何利润或收益作出判决,具体金额将在审判中确定;根据17 U.S.C.§504,对ROSS的故意侵权行为作出法定赔偿判决;根据ROSS对West与LegalEase之间合同关系的恶意干扰,作出惩罚性赔偿判决,具体金额将在审判中确定;根据17 U.S.C.§505,判给原告因本案所支付的费用,包括合理的律师费和费用;判给原告自判决前至判决后的利息,利息金额按照法律允许的最高限度计算;法院认为公正合理的其他任何救济措施。

明天看一下被告答辩与反诉情况。

来源:YunfangW

相关推荐