擅自抓取、存储和使用商业数据构成不正当竞争的认定

B站影视 欧美电影 2025-09-04 09:11 2

摘要:这是一个非常专业且在实践中极具争议的法律问题。擅自抓取、存储和使用商业数据是否构成不正当竞争,并非一个简单的“是”或“否”的问题,而是需要根据具体案情,依据《中华人民共和国反不正当竞争法》(以下简称《反不正当竞争法》)进行综合判断。

这是一个非常专业且在实践中极具争议的法律问题。擅自抓取、存储和使用商业数据是否构成不正当竞争,并非一个简单的“是”或“否”的问题,而是需要根据具体案情,依据《中华人民共和国反不正当竞争法》(以下简称《反不正当竞争法》)进行综合判断。

以下是对该问题认定的详细分析:

《反不正当竞争法》第二条(原则性条款)经营者在生产经营活动中,应当遵循自愿、平等、公平、诚信的原则,遵守法律和商业道德。本法所称的不正当竞争行为,是指经营者在生产经营活动中,违反本法规定,扰乱市场竞争秩序,损害其他经营者或者消费者的合法权益的行为。这是认定新型、未被具体列举的不正当竞争行为的“兜底条款”,在数据抓取案件中应用极为广泛。《反不正当竞争法》第十二条(互联网专条)“经营者利用网络从事生产经营活动,应当遵守本法的各项规定。经营者不得利用技术手段,通过影响用户选择或者其他方式,实施下列妨碍、破坏其他经营者合法提供的网络产品或者服务正常运行的行为:……(四)其他妨碍、破坏其他经营者合法提供的网络产品或者服务正常运行的行为。”擅自抓取行为通常被视为利用技术手段破坏他人商业模式的“其他”行为。

在司法实践中,法院通常会采用一种逐步分析的框架,主要审查以下三个层面:

法院首先会审查原告主张的数据集合是否蕴含了其劳动和投资,是否值得法律保护。并非所有数据都天然受到保护。

受保护的数据类型数据库(Data Compilation):即使单个数据是公开的(如企业信息、用户评论、价格数据),但经过大量的收集、整理、校对、编排,形成了具有系统性、整体性的数据库,就构成了《反不正当竞争法》意义上的竞争利益或“合法权益”。法院可能认定其构成“实质性投入(Labour and Investment)”。原始数据(Raw Data):平台生成的用户行为数据、交易数据等,因其具有商业价值且是平台运营的核心资产,也受到保护。衍生数据(Derived Data):经过算法加工、分析后产生的数据产品(如用户画像、行业报告),其保护强度更高。不受保护或弱保护的情形:纯粹的单条公开信息(如一个电话号码)。数据集合未体现任何编排、整理的劳动投入。数据本身属于公共领域或必须公开的数据(如政府公开数据),但抓取方式和使用方式可能仍构成不正当竞争。

这是认定的核心。法院会综合多项因素判断抓取、存储和使用行为是否违背了“诚实信用”和“商业道德”。

抓取手段的性质违反Robots协议:Robots协议是互联网行业公认的抓取许可标准。故意违反Robots协议进行抓取,是认定行为不正当性的强烈信号突破技术措施(“破坏爬虫协议”):如果原告设置了反爬虫技术(如验证码、IP限制、账号权限),被告通过技术手段强行突破,这种行为本身就被视为具有不正当性。使用虚假身份、伪装正常用户:通过模拟登录、伪造User-Agent等方式绕过监管,也被视为欺骗性手段。抓取行为的规模与后果大规模、全量抓取:超出了合理范围,尤其是对服务器造成巨大负担,可能构成《反不正当竞争法》第十二条所述的“妨碍、破坏网络产品或者服务正常运行”的行为。使用数据的目的和方式(“搭便车”与“实质性替代”)是否构成“搭便车(Free-riding)”:被告是否直接利用了原告投入大量成本获取的数据成果,节省了自身成本,却未做出实质性贡献或创新。是否构成“实质性替代(Market Substitution)”:被告使用数据的方式,是否导致用户无需再访问原告的平台,从而实质性替代了原告提供的产品或服务,攫取了本应属于原告的市场机会和流量。这是认定构成不正当竞争的关键因素是否用于创新性转换(Transformative Use):如果被告对数据进行了深度分析、加工,形成了全新的、具有独立价值的产品或服务(如宏观行业趋势报告,且不提供原始数据),而非简单地“复制”和“搬运”,则更可能被认定为创新性使用,不构成不正当竞争。

法院需要确认被告的行为是否对市场竞争秩序和原告的合法权益造成了损害。

对原告的损害:包括服务器负载增加、流量流失、商业机会减少、竞争优势被削弱等。对市场竞争秩序的损害:如果这种行为被默许,会形成“劣币驱逐良币”的效应,打击市场主体收集、加工数据的积极性,最终损害整个市场的创新活力,扰乱公平竞争的市场秩序对消费者的损害:可能导致数据来源混乱、信息准确性下降,或消费者选择减少。大众点评诉百度案案情:百度通过爬虫抓取大众点评上的用户评论,直接在其百度地图、百度知道等产品中展示。判决:法院认为,用户评论是大众点评的核心资产,投入了大量成本。百度的大规模、全量抓取行为,实质性替代了用户对大众点评的访问,构成了“搭便车”和不正当竞争。此案确立了“实质性替代+搭便车”的认定标准。微博诉脉脉案案情:脉脉通过授权登录方式获取新浪微博用户信息后,超越授权范围抓取并使用了下述非用户信息,并误导用户认为其好友关系来自手机通讯录。判决:法院提出了“用户授权”+“平台授权”+“用户授权”三重授权原则,强调第三方在获取用户数据时,必须同时尊重用户意愿和平台方的合法权益。违反此原则即构成不正当竞争。谷米诉元光案案情:元光公司通过技术手段,非法爬取谷米公司“车来了”APP的实时公交数据。判决:法院认定,被告利用技术手段破坏原告的防爬虫措施,非法获取、使用他人竞争性数据,构成不正当竞争。

擅自抓取、存储和使用商业数据很可能被认定为不正当竞争,如果同时满足以下条件:

数据本身:原告的数据集合包含了实质性的劳动和资本投入,具有商业价值。抓取手段:抓取行为违反了行业规则(如Robots协议)、突破了技术保护措施、或采用了欺骗性手段。使用效果:使用数据的方式直接“搭便车”,并实质性替代了原告的服务或产品,攫取了其市场利益。损害结果:给原告造成了实际损害,并扰乱了健康的市场竞争秩序。

对企业/开发者的建议:

合规先行:在进行数据抓取前,务必审查:目标网站/平台的Robots协议和用户协议。数据来源的合法性。抓取行为是否会给对方服务器带来过度负担。获取授权:尽可能通过API等官方授权渠道获取数据。创新使用:如果必须使用公开数据,应致力于进行创新性转换,提供不同于原数据源的、具有独立价值的新服务,避免简单的“搬运”和“复制”。咨询法律专家:在开展可能涉及大规模数据抓取的项目前,强烈建议咨询专业律师进行合规评估。

总之,法律并非禁止一切数据抓取,而是禁止那些以不正当手段进行、旨在“搭便车”和“不劳而获”、最终破坏创新和公平竞争秩序的行为。

来源:左文说法一点号

相关推荐