摘要:人脸识别证据在刑事诉讼中已广泛应用,但其形成机理、证据类型及适用规则存在争议。在形成机理上,不同人脸识别技术所使用的底层原理相同,人脸识别证据可以归于一类进行讨论并统一规范。人脸识别证据虽然以大数据为基础而形成,但其仅将大数据作为算法的训练材料,有别于大数据证
【珠海律师、珠海法律咨询、珠海律师事务所、京师律所、京师珠海律所】
(本文转载自北京市京师上海律师事务所)
►作者:兰跃军、董和敏
【摘 要】人脸识别证据在刑事诉讼中已广泛应用,但其形成机理、证据类型及适用规则存在争议。在形成机理上,不同人脸识别技术所使用的底层原理相同,人脸识别证据可以归于一类进行讨论并统一规范。人脸识别证据虽然以大数据为基础而形成,但其仅将大数据作为算法的训练材料,有别于大数据证据。在证据类型上,人脸识别证据系对争议案件事实的一种推断,属于意见证据;人脸识别算法因其自主学习性、生成性和难以解释性而具有做出意见的能力,此类证据应为算法意见。在适用规则上,应当适当扩大意见证据规则的内涵,将人脸识别算法意见纳入其调整范围;同时,明确人脸识别证据属于专门性证据或专家意见,对人脸识别证据的可信性采用多伯特规则进行检验,并且无需开示算法。
【关键词】人脸识别证据 大数据证据 意见证据 算法意见
在当今数字化时代,科技的迅猛发展不仅改变了社会生活的方方面面,也深刻影响着司法领域的运作与实践。在此背景下,人脸识别技术作为一项重要的科技手段在司法实践中的重要性日益凸显,人脸识别结果在刑事诉讼中已被广泛应用。[1]“人脸识别作为刑事证据之运用”已成为学界亟须面对的现实问题。然而,有关人脸识别证据的若干理论问题尚未达成共识,主要包括三个方面:第一,当前人脸识别技术尚不统一,基于不同人脸识别技术所产生的人脸识别证据能否归于一类进行讨论?有学者将人脸识别证据纳入大数据证据进行讨论,[2]人脸识别证据能否等同于大数据证据?第二,人脸识别证据是否属于意见证据?如果属于,它又属于谁的意见?是人类意见,还是算法意见?或者二者兼而有之?2012年AlexNet所提出深度学习技术几乎在算法设计、训练数据集、应用场景乃至评估协议等所有方面重塑了人脸识别技术的研究格局,[3]这是否使得人脸识别证据已经区别于传统机械运算生成的证据而具有做出意见的能力?第三,人脸识别证据能否及如何适用意见证据相关规则加以审查?这些都是人脸识别证据运用亟待研究解决的重大问题。
一、人脸识别证据的形成机理
人脸识别证据是人脸识别技术在刑事诉讼中应用的结果。研究人脸识别证据首先需要剖析人脸识别技术的底层原理,才能为下文界定其证据类型和构建其适用规则提供理论支持。
(一)人脸识别技术的底层原理
人脸识别技术属于生物特征识别技术领域,它是指在给定一个场景的静止或视频图像下,使用存储的人脸数据库来识别或验证场景中的一个或多个人身份的鉴别技术。[4]在刑事诉讼中,人脸识别技术主要用于面部验证和面部识别,前者也被称为一对一匹配,是将人脸图像与声称身份的模板人脸图像进行比较,[5]通常用于确认在场人员的身份,例如,警方对于可疑人员通过安全检查点检查的身份验证;后者又称一对多或“1对N”搜索,是指将图像中提取的人脸特征与人脸识别数据库中登记的所有特征向量进行比较,算法会对所有N个录入进行穷举搜索并进行排序操作以得到最相似的结果,然后返回一定数量的最相似候选人,或产生相似度分值。[6]一对多搜索常与实时监视摄像机叠加应用,例如,在谢永锡交通肇事一案中,法院就是依据洪江市某路段带有人脸识别功能的监控摄像头认定肇事者为谢永锡。[7]
人脸识别技术因开发人员而异,但在底层原理上是相同的,通常包含三个步骤,即人脸检测、特征提取和人脸匹配。[8]
图1 人脸识别技术底层步骤
如图1所示,人脸识别系统首先从特定图像中的人脸检测开始,目的是确定输入图像是否包含人脸。[9]为了提高人脸识别系统的稳健性,需要对人脸进行预处理,因为光照和面部表情等因素可能导致人脸检测受到干扰。其次,提取在检测步骤中检测到的人脸图像的特征。当前人脸识别技术所采取的特征提取方法包括传统方法和基于深度学习的方法两类。然而,传统特征提取方法因识别精度不高、计算性能有限等原因而日渐式微,基于深度学习的特征提取技术渐成主流。当前流行的基于深度学习的人脸识别网络包括VGGNet、ResNet和ANN。在这一步骤中,开发人员使用大数据集训练神经网络来学习稳定的人脸表示,[10]随后使用经训练的神经网络进行特征提取。最后,算法比较两个特征向量,并计算相似度得分。该得分是一个由供应商定义的数值,用于表示脸部之间的相似程度,它与一个阈值进行比较,以确定两个样本是否属于同一人或代表同一人。[11]
虽然当前人脸识别技术尚不统一,其差异主要集中在人像的预处理、人脸匹配的具体方式上,但人脸识别技术所使用的底层原理是相同的,其使用基于深度学习的算法作为特征提取的底层原理的技术趋向相同,因此,人脸识别技术可以归于一类进行讨论,并对不同的人脸识别技术所产生的人脸识别鉴定结果进行统一规范。
(二)人脸识别证据与大数据证据的关系
大数据证据并不是一个法定术语,其是科技与法律相结合的复合型概念,是对使用大数据或者以大数据为基础而形成的证据的统称。当前学界对于大数据证据之界定存在着认识不一的情况,主要体现在三个方面:其一,对大数据证据一词是否成立存在争议,有学者直接否定其存在的正当性,认为当前刑事诉讼法尚未出现大数据证据的语词使用,其在司法实践中是以位置跟踪匹配、对超越人力分析能力的大量数据的机器分析等形式出现的。而且大数据证据较以往传统的信息化侦查实践所得出的证据并无实质革新。[12]其二,对大容量证据是否等同于大数据证据存在争议,主要存在肯定说和否定说两种观点。有学者主张大数据证据即是具有大容量数据的证据,其将GPS坐标数据、汽车事件数据、记录系统数据等均纳入大数据证据。[13]有学者否定该观点,认为大容量的数据不等于大数据,大数据证据的关键在于有利用数据的意识,无论数据的大与小。[14]还有学者在否定论的基础上提出数据的大容量是大数据证据的基础,但大数据证据同时还需要具备新的价值增量、经过二次加工等特点。[15]其三,对大数据证据的证据实体存在争议,主要存在大数据分析报告说、大数据分析报告和大数据集说、全覆盖说三种观点。大数据分析报告说认为,大数据证据之实体仅仅指向最终形成的大数据分析报告,而不包括在案件发生前已然存在的大数据集。[16]大数据分析报告和大数据集说认为,大数据证据应由大数据集和大数据分析报告两重实体组成,并在此基础上提出大数据证据的二元构造说。[17]目前持这种观点的学者较多,有学者将GPS坐标数据纳入大数据证据,本质上认为大数据集也属大数据证据实体。[18]全覆盖说认为,大数据证据即是与大数据相关的所有实体,其将大数据的原始载体亦纳入大数据证据的范畴。[19]
学界对于大数据证据一词认识的模糊与争议,使得部分观点自相矛盾,[20]阻碍学者们站在同一维度进行有效对话。换言之,在大数据证据一词是否成立、其内涵和实体指向等前提问题尚未达成共识的情况下,人脸识别证据能否等同于大数据证据,尚有待深入研究。
在大数据证据的外延上,将所有以大数据为基础而形成的证据都纳入大数据证据,有扩大其外延之嫌。不可否认的是,人脸识别鉴定结果的生成确实有赖于大数据。当前最先进的人脸识别技术利用大规模人脸数据集如CASIA-WebFace,MS-Celeb-1或VGGFace2来训练具有数百万可训练参数的深度神经网络。[21]这使得人脸识别证据与大数据证据在外观上呈现许多相类似的地方,如大数据证据对大数据集进行二次挖掘、分析等处理,最终以大数据报告的形式呈现,而人脸识别证据是算法对输入人像进行分析比对,最终以人脸识别结果的形式呈现。然而,并非所有以大数据为基础形成的证据,均能归为大数据证据,人脸识别证据不能简单等同于大数据证据。人脸识别鉴定结果生成的机理是利用人脸识别数据库训练算法,然后使用被人脸数据库训练过的算法对输入的图像进行分析,给出人脸识别相似度报告。[22]这与大数据分析报告的生成机理不同,后者是由算法对大数据集进行处理,从大数据中清洗、筛选、挖掘数据而输出的具有某种实用价值的分析结论。[23]
图2 大数据分析报告和人脸识别鉴定结果机理对比
如图2所示,在人脸识别证据中,人脸数据库或者大数据集仅仅作为算法的训练材料。人脸识别鉴定结果并不来自对大数据集中某一条或者若干条数据的挖掘或分析,而是来自于对与案件有关的图像的输入的分析对比。也就是说,人脸识别数据库与最终的人脸识别鉴定结果仅仅存在着弱关联,人脸识别证据对于大数据之运用仅仅为间接运用。而在大数据证据中,大数据集本身既是案件材料,也是算法分析的对象,大数据分析报告最终来自于对大数据的挖掘。大数据集与最终的大数据分析报告之间关联性更强,且大数据证据对于大数据之运用为直接运用。因此,人脸识别证据虽以大数据为基础而形成,但其仅仅将大数据作为算法的训练材料,不能被视为大数据证据。
二、人脸识别证据的证据类型
在分析人脸识别证据的形成机理,并厘清其与大数据证据关系的基础上,可以进一步界定人脸识别证据的证据类型。
(一)人脸识别证据属于意见证据
区分事实和意见是现代证据法的基本要求。英国学者将“意见”一词定义为从已知的事实中做出的推论。[24]美国学者认为,“意见”特指一种未经完全证实的推论、想法或者结论。[25]在我国,根据《最高人民法院关于适用的解释》(以下简称《高法解释》)第88条第2款有关意见证据规则的规定,[26]“意见”是指具有猜测性、评论性、推断性的陈述。由此可见,证据法中的“意见”,是指对争议事实所做出的未经证实的具有猜测性、评论性、推断性的陈述。
在刑事诉讼中,人脸识别证据的功能是对犯罪主体是否同一这一争议事实给出推断。例如,在杨华华盗窃案中,人脸识别证据对四宗盗窃事实的主体是否均是杨华华给出结论,认为四宗盗窃案截图与杨华华相似度均达90%以上。[27]而且人脸识别证据具备意见证据的三大特征:一是意见性,这里意见是相对于事实而言的。事实陈述主要强调的是人们对已经发生或正在发生的事件、事情及其过程、状态等的客观描述。[28]而意见主要是指对人物、事件或社会等所持的一种看法、见解、评价或立场等,其特征落脚为一种评价性的表态。[29]人脸识别证据是利用人脸识别技术进行搜索后生成的、以相似率表达的鉴定结果。以似然率为表现形式的鉴定结果涉及对人脸图像是否相同的评价性表态,因此,人脸识别证据具有意见性。二是派生性,任何种类的意见证据实际上都是一种以派生证据的形式出现的证据。[30]人脸识别证据以人脸识别技术为依据,将原生于案件事实的图像或者视频作为其分析对象,最终得出以人脸相似度为内容的派生证据,因此,具有派生性。三是事后性,是指证据存在或形成于案件事实发生之后。人脸识别证据与普通证人的意见、鉴定意见类似,均是在案件事实发生后形成的。为此,人脸识别证据是对争议案件事实给出的一种推断性陈述,具有意见证据的意见性、派生性和事后性,其属于意见证据。
(二)人脸识别证据属于算法意见
人脸识别证据所使用的深度学习算法属于机器学习的一个分支,其源自对人工神经网络的研究。具体而言,深度学习受人类大脑处理输入信息时分层机制的启发,通过构建模拟人脑进行分析学习的神经网络,模仿人脑的机制来解释数据。如果说人的学习是通过观察获得某种技能的过程,那么深度学习就是在用计算机模仿这一过程。与传统计算机系统相比,基于神经网络的深度学习网络系统具有自主学习性、生成性和难以解释性三方面特征。其一,自主学习性。深度学习算法具有“学习性”,其能够学习原始数据和高层次表征以及抽象概念之间的关系。具体而言,深度学习通过堆叠基础模型构建一个含有多个隐含层的神经网络进行学习。在这个网络中,第一层通过比较相邻像素的亮度,很容易识别边缘。有了第一隐藏层描述的边缘,第二隐藏层可以搜索能够识别角和扩展轮廓的边集合。给定第二隐藏层中描述的角和轮廓,第三隐藏层可以找到特定对象的整体部分,如轮廓和角的特定集合。这样,该算法就可以识别图像中存在的对象。[31]另一方面,深度学习算法的这种学习是“自主的”,其在进行学习时不需要进行人工干预,可以自学成才。[32]例如,2012年谷歌的工程师创造了一个早期的AlphaGo版本,它自学识别了猫。在没有告知算法任何有关猫的信息的情况下,工程师们让其检查了13026张猫的图片和23974张没有猫的图片。尽管工程师们没有提供任何关于猫的指示,但该系统最终自行检测出了猫的共同特征,并报告了它对这种常见实体的发现。[33]其二,生成性。根据联合国教科文组织发布的《生成式人工智能教育与研究应用指南》,基于深度学习的人脸识别技术属于生成式人工智能技术的一部分。所谓“生成性”,是指经过自主学习后,算法或模型所具有的能够根据已有的数据或规律生成出新的、具有相似特征的数据或内容的能力。换言之,算法可以利用现有内容,产生新的内容。[34]深度学习的神经网络算法之所以具有生成性,是因为它们可以利用海量数据来学习复杂的分布,并据此生成新的数据。以生成对抗网络为例,GAN利用两个互相对抗的神经网络,一个是生成模型,一个是判别模型,其原理是生成模型的目标是生成尽可能接近真实数据的假数据,而判别模型的目标是区分真实数据和假数据。这两个模型通过不断竞争和学习,最终达到一个平衡点,使得生成模型能够生成足以欺骗判别模型的数据。[35]其三,难以解释性。神经网络和深度学习的应用模糊了计算机系统的细节,以至于即使是算法的设计者也不能完全理解它是如何工作的。[36]一方面,人类无从知晓神经网络中的“概率加权”,因而无法感知神经网络的实际运作方式。神经网络的“神经元”通过给数据元素之间的关系添加特定的权重来模拟脑功能。[37]而由于这些“神经元”是自主组织起来的,人类不仅不能确定元素被如何加权,甚至都无法确定哪些元素被加权。另一方面,神经网络的多层次结构加大了人类解释的难度。具体而言,神经网络的层数与决策的复杂性相对应。为了使决策变得更加精细和准确,神经网络通常需要有多个层数,有的甚至包含数百甚至数千个隐藏层。神经网络的层数越多,算法就越复杂,算法所包含的逻辑就越深奥,人类就越难以对其进行解释。此外,由于算法会自动地不断学习和改变,从而变得更加高效。因此,即使一个算法可以被解释,它也只能在算法再次改变之前暂时被解释。
正是深度学习网络所具有的自主学习性、生成性和难以解释性,使得算法具有做出意见的能力。人类意见之做出,分为感知和信息获取、认知和思维、推理和逻辑三个阶段。同样,算法意见之形成亦遵循这一逻辑,其能够进行感知、认知和逻辑推理。一方面,算法所具有的自主学习性,使其能够模仿人类对世界进行感知和认知。具体而言,算法通过图像等多种输入形式获取信息,并通过深度学习识别图像中存在的对象并发现实体。这使得算法能够像人类一样感知周围环境、识别对象,从而为之后算法推断打下基础。另一方面,算法所具有的生成性使得其能够根据所获取的信息和知识对某项新的事实做出自己的推断。例如,当前人脸识别技术的准确率已达99.98%,在识别犯罪主体同一性的问题上,其精度已远超过人类。[38]况且,与算法的决策过程类似,人类某些意见之形成也难以进行解释。例如,在识别图像中的人脸是否相同的问题上,人类往往可以凭借直觉轻松做出判断。
有学者可能以当前算法与人类尚存差距为由,而否定算法所具有的做出意见的能力。例如,当前机器或者算法不仅无法像人类一样拥有感觉或者情感,甚至在模仿人类交谈方面都存在困难,当前尚没有算法能够通过图灵测试。[39]而且,目前基于神经网络的深度学习网络的算法与人脑尚存差距。仅就神经元的数目而言,“谷歌大脑”的内部神经元个数(10亿),相比于人类大脑的神经元个数(150亿),仍差一个数量级。除非有能力迅速扩展新技术,否则,至少要到21世纪50年代,人工神经网络才能具备与人脑相同数量级的神经元。[40]然而,需要注意的是,算法是否具有做出意见的能力,并不意味着算法需要完全等同于人类,或者在所有问题上均以人类的思维方式思考并拥有情感。欧盟于2024年3月13日通过的《人工智能法》明确指出,人工智能系统具有两大特征:一是推理能力,这是人工智能系统的一个主要特点,这种推理指的是获得输出的过程,如预测、内容、建议或决策,也指代人工智能系统从输入/数据中推导出模型和/或算法的能力。二是自主性,人工智能系统在设计上具有不同程度的自主性,这意味着它们的行动在一定程度上独立于人类的参与,并具有在没有人类干预的情况下运行的能力。由此可知,法律意义上的人工智能并不需要完全等同于计算机科学领域的人工智能,[41]其只需要在单一的、定义良好的任务中模拟人类的表现,拥有推理能力和自主性即可。而人脸识别算法具有自主性和推理能力。一方面,人脸识别算法能够在没有外部指令的情况下对特定的数据进行操作,且当引入新数据时,算法能使用先前学到的特征来识别数据的类别,具有推理能力。另一方面,人脸识别算法能够基于标记或者无标记的一组输入和输出训练集,学习如何关联输入和输出,具有自主性。[42]因此,不能以人脸识别证据无法在各种任务中等同于人类且缺失情感而否定其做出意见的能力。此外,机器学习模型中每个神经元的连接数量已经与哺乳动物的大脑在同一数量级上,当前人工神经网络中神经元之间的连接数已不再受限于硬件能力,而主要考虑设计需求。[43]例如,在某些人工神经网络中,有的神经元的连接数需要与猫的数量相当,而有的则只需要与较小的哺乳动物如小鼠相当。具体到人脸识别技术中,当前基于深度学习的知名模型FaceNet仅使用了1个深度卷积网络,却仍然达到了99.63%的准确率,超过了人眼识别率99.25%。[44]虽然人脸识别的深度学习算法中神经元的数量远不及人脑,但当前所使用的神经元连接数足以使其完成人脸识别任务。因此,不应以人脸识别算法神经元数量小于人脑神经元连接数为由而否认算法做出意见的能力。
由于深度学习算法具有自主学习性、生成性和难以解释性,算法本身具有做出意见的能力,因此,人脸识别证据属于意见证据,但与传统的意见证据相比,其又具有特殊性,不同于普通证人或专家证人(或鉴定人)的人脑生成的意见,它是由具有做出意见能力的算法生成的算法意见。这种算法意见目前无法纳入《刑事诉讼法》第50条规定的八种证据之中,其作为一种新证据类型,笔者认为,它应当归于《高法解释》第100条所规定的作为一种专门性证据的专门性问题报告,[45]即“有专门知识的人就案件的专门性问题出具的报告”,其与鉴定意见、事故调查报告一样,都属于专家意见。《刑事诉讼法》第四次修改时,应当吸收《高法解释》第100条、第101条规定和现代科技发展成果,将第50条第2款第6项规定的证据种类“鉴定意见”改为“鉴定意见及其他专门性意见”或“专家意见”,[46]为人脸识别证据等算法意见的合法性提供依据。
三、人脸识别证据的适用规则
人脸识别证据作为一种算法意见,在司法适用中具有特殊性,需要制定不同于普通意见证据的专门证据规则,才能对其适用予以规制。
(一)人脸识别证据纳入意见证据规则的调整范围
人脸识别证据等算法意见已经在实践中广泛运用,但此类算法意见在境内外现行法律框架下尚缺乏规制基础,还未被纳入意见证据规则的规范体系之中。
在美国,目前还没有任何州或联邦案件讨论算法意见的可采性。[47]《美国联邦证据规则》第701条至第703条规定,意见证据规则排除普通证人基于其自身看法、观点或者推论的证言,[48]但允许专家证人就科学、技术或者其他专门知识帮助事实审判者理解证据或者确定争议事实。[49]从美国法律规范及判例看,意见证据的规范对象仍然限于人的意见,不包含算法意见。此外,《澳大利亚联邦证据法》第76条至第79条规定,除非意见是基于个人对事物或事件的感知为基础且对事物或事件的充分说明有必要或者是专家意见,否则,不得采纳意见证据以证明所表达意见的事实之存在。《日本刑事诉讼法》第156条第1款和《日本刑事诉讼规则》第199条之13规定,[50]证人必须基于其个人的知识和经验叙述事实,而不允许陈述单纯的意见和推论,除非其根据直接的经验陈述他所推测的事项。[51]《俄罗斯联邦刑事诉讼法典》第75条规定,被害人、证人基于猜测、假设、传闻所做出的陈述不允许采信。[52]《菲律宾证据规则》的规则130第42条至第44条规定,证人的意见一般不具有可采性,除非是专家证人的意见或者普通证人对足够了解的某人的身份、笔迹、精神健康状况等作证。可见,澳大利亚、日本、俄罗斯、菲律宾等意见证据规则都仅仅规范人的意见,而未对算法意见做出规定。根据我国《刑事诉讼法》第146条、《高法解释》第88条第2款和《关于办理死刑案件审查判断证据若干问题的规定》第12条第3款规定,[53]我国同样仅对普通证人以及专家证人(即鉴定人、专家辅助人)所发表的意见进行规范,而对于算法意见尚未有明确规定。
为此,笔者认为,在科技领域不断涌现新突破的新时代背景下,需要重新诠释意见证据规则中“意见”的内涵,将算法意见纳入其规范范围。具体而言,意见证据规则所规范的“意见”,不仅包括自然人所发表的意见,而且包括算法所生成的意见。这样,人脸识别证据就能够按照意见证据规则适用并予以规制。
(二)人脸识别证据参照专门性证据或专家意见相关规则
在证据法领域,意见证据分为普通证人意见和专家证人意见(或鉴定意见、专家意见),两者在证据资格和审查规制上存在显著差异。普通证人意见证据通常基于个人的经验或感知,并涉及对所观察或经历事件的推断。这类证据往往因其与待证事实缺乏关联性而不具有证据资格。而专家证人意见则是基于专家的知识、技能、经验,通常具有证据资格。法庭对专家证人意见的审查主要侧重于专家证人(或鉴定人)的资格、所依赖的理论和技术的科学性和可靠性以及意见据以产生的数据和事实等。因此,确定人脸识别证据属于专家证人意见还是普通证人意见,对规制人脸识别证据至关重要。
有关专家证人意见与普通证人意见之界分标准,当前学界存在一种观点,即,某项意见是否属于专家证人意见,取决于该意见所判断的事项是否涉及专门性的知识。[54]如果被判断事项在认知与理解难度上超越一般公众的认识水平和能力,那么,该事项涉及专门性知识,对该事项进行判断的意见为专家证人意见;反之,则为普通证人意见。为此,某些学者可能主张人脸识别证据不属于专家证人意见。毕竟,识别人脸似乎并不需要具有很强的专业性和科学性,具有正常认知能力的普通人借助视觉观察即可完成。然而,此种界分标准存在两方面问题。一方面,该观点存在概念上的混淆,将专家证人意见等同于对针对专门性事项所发表的意见。专门性事项只能依赖专家证人意见来解决。而专家证人意见既可以解决专门性事项,也可以解决普通性事项。另一方面,概念上的混淆源自于判断层次的混乱。判断专家证人意见与否的问题可以分为两个层次:第一层是某意见是否属于专家证人的意见;第二层是针对被判断的事项(包括专门性事项和普通性事项),该专家证人意见是否有必要使用或采纳。将专家证人意见等同于针对专门性事项所发表的意见的定义方式,直接跳过了第一层次的判断,将专家证人意见的涵义问题直接等同于专家证人意见是否有必须使用的问题。该观点所隐含的内在前提是:对于普通性事项,审判者没有必要使用意见予以辅助判断。针对普通性事项所发表的专家证人意见,由于其丧失了采纳的必要性,而不能被称之为专家证人意见或专家意见。
但实际上,某项意见是否为专家证人意见,不应仅仅取决于其所判断事项的专门与否,而取决于其自身是否使用了专门性知识。有别于普通人基于肉眼的直觉判断,人脸识别证据使用基于深度学习算法的特征提取技术识别人脸,具有关于人脸识别领域的专业知识,所给出的意见应为专家证人意见或专家意见。司法部2021年发布的《人像鉴定中人脸识别技术检验规范》(SF/T 0106—2021)也持该观点,其第5.5.3条规定:“人脸识别技术是针对人像特征中的人脸五官形态及其配置关系特征的有效检验”,以规范的形式确认了人脸识别证据所使用技术的专业性。
需要进一步回答的是,人脸识别证据是否有必要使用或采纳。当照片或者视频模糊不清以至于审判者无法依据其自身经验判断时,人脸识别证据当然具有采纳的必要性。然而,在照片清晰而普通人可以肉眼识别的情况下,人脸识别证据还具有采纳的必要性吗?换言之,针对普通性事项,专家证人意见是否仍具有采纳的必要性?对于专家证人意见是否可采,《美国联邦证据规则》第702条确立了“帮助事实审判者”标准,具体而言,即使陪审团对意见证据所涉事实具有通常的知识,如果专家证人的意见证据有助于陪审团对于争议事实的理解,该意见证据也是可采的。[55]虽然我国《刑事诉讼法》并未明确专家证人意见的“帮助事实审判者”标准,但也没有否定针对普通性事项的专家证人意见的证据资格,第146条仅对专门性事项需要专家证人意见作了正向规定。[56]因此,针对普通性事项的专家证人意见,只要其有助于审判者理解或者确定有关问题,仍可以将其采纳。在照片清晰且普通人可以识别的情况下,法官仍可以采纳人脸识别证据以印证犯罪主体的同一性。
(三)人脸识别证据的可信性规则
专家意见的审查除了合法性,还包括关联性和可信性(或客观性、真实性)两个方面。就人脸识别证据而言,其关联性审查方式较传统专家证人意见而言,并未发生实质性变化。人脸识别证据的审查应重点关注可信性问题。关于人脸识别证据可信性的验证,主要涉及两个问题:一是人脸识别证据应当采取哪种可信性检验规则;二是人脸识别证据开示的范围何在,是否有必要开示算法及源代码。
一方面,人脸识别证据可以借鉴美国做法,采用多伯特规则进行检验。我国《刑事诉讼法》及其司法解释在审查鉴定意见时,主要偏重审查鉴定机构和鉴定人员、鉴定程序是否合法等外部性问题,对科学证据所依据的理论、技术和方法等内部性问题的审查不足。[57]美国的多伯特规则可供我国借鉴,该规则主要包括五个方面内容:一是该技术是否可以或已被检验;二是该技术是否经过同行评审和发表;三是该技术已知或可确定的错误率;四是否有使用该技术的公认标准;五是该技术是否在相关专业领域得到普遍接受。需要注意的是,对于第一项内容,美国国家标准和技术研究所(NIST)所主办的面部识别供应商测试(FRVT)可作为独立检验人脸识别技术的方式之一,该测试是评估人脸识别技术的黄金标准。[58]对于第四项内容,我国司法部《人像鉴定中人脸识别技术检验规范》第5.4条规定,在人像鉴定中使用人脸识别技术的检验方法和步骤,可以作为操作人脸识别技术标准的参考。至于其他几项检验内容,由于人脸识别技术的多样性,需要结合具体案件所使用的技术予以具体判断。
另一方面,检验人脸识别证据仅需开示诸如原始图像和对比图像、人脸识别数据库、人脸识别系统的错误率等非核心信息,无需开示算法及源代码。在人脸识别算法是否需要开示的问题上,持肯定论的学者主要基于审查算法可靠性的考虑,认为算法透明是审查算法真实可靠的有效路径。[59]毕竟,方法的有效性并不等同于软件驱动实施方法的有效性,仅仅了解程序方法背后的基本原则,难以检测到程序中常见的错误。[60]只有知晓算法所依赖的理论和技术如算法的训练方法、数据选择的方式等,才能对算法生成的证据进行有效分析。[61]然而,第一,就人脸识别证据而言,算法开示并无足够的必要性。这是因为,深度学习算法使得算法即使开示,也不能有效检验人脸识别证据的可靠性。深度学习算法能够自动发现数据中的复杂结构,其所习得的模式属于隐含知识,算法设计师也难以完全解释其工作原理。因此,即使算法透明开示,也难以实现算法可知。[62]相反,不开示算法亦能检验算法的可靠性。如黑盒测试,它不需要了解算法内部的工作原理,即可评估算法的准确性和可靠性。[63]黑盒测试只检查程序是否能够按照需求规格说明书的规定正常使用,是否能够正常的接收输入数据,并产生正确的输出信息。第二,算法开示缺乏相关性基础。在刑事案件中,计算机代码的内容与案件事实只是间接相关——算法代码只涉及科学工具的可靠性,而科学工具才是用于产生对被告有争议事实的证据。[64]第三,算法开示还与商业秘密保护相悖。一般而言,算法是人脸识别技术的核心秘密,应当予以保护,只有在特殊情况下才可以要求其公开。在美国,开示商业秘密需符合相关性和必要性的要求。[65]寻求披露商业秘密信息的一方,可以通过证明这些信息对审判具有高度相关性和必要性,来打败商业秘密特权主张。[66]也就是说,商业秘密只有在“高度相关且审判必要”的条件下才需要开示。我国《刑事诉讼法》虽然没有相关条款,但从法理上看,由于开示人脸识别算法缺乏必要性和相关性基础,为检验人脸识别证据而开示算法也没有充分依据。因此,检验人脸识别证据仅需开示非核心信息,无需开示算法及源代码。
四、结语
人脸识别证据作为现代科学技术在刑事诉讼中运用,其科技属性与法律属性交织重叠,给传统证据法带来前所未有的挑战和机遇。一方面,深度学习网络系统所具有的自主学习性、生成性和难以解释性,使得算法具有做出意见的能力。另一方面,算法意见在规制上却面临着无法可依的困境。为此,需要重新诠释意见证据中“意见”的内涵,明确人脸识别证据属于算法意见的意见证据属性,并构建相应可信性检验规则。随着人脸识别证据的广泛应用与人工智能的迅猛发展,未来势必会涌现出更多科技与法律的交织的新问题,有待学界进一步探究。
参考文献
[1] 笔者以“全文:人脸识别结果;案由:刑事案由;案件类型:刑事案件”等关键词在中国裁判文书网进行检索,截止2024年6月4日,得到案件3161件。
[2] 参见谢君泽:《论大数据证明》,载《中国刑事法杂志》2020年第2期,第130页;林喜芬:《大数据证据在刑事司法中的运用初探》,载《法学论坛》2021年第3期,第30页;马明亮、王士博:《论大数据证据的证明力规则》,载《证据科学》2021年第6期,第646页;卫晨曙:《论刑事审判中大数据证据的审查》,载《安徽大学学报(哲学社会科学版)》2022年第2期,第79页。
[3] See Wang M & Deng W, “Deep Face Recognition: A Survey”, 429 Neurocomputing 215, 216 (2021).
[4] See Zhao W, et al., “Face Recognition: A Literature Survey”, 35 ACM Computing Surveys(CSUR) 399, 400(2003).
[5] See Abate A F, et al., “2D and 3D Face Recognition: A Survey”, 28 Pattern Recognition Letters 1885, 1886(2007).
[6] See Grother P, Ngan M & Hanaoka K, Face Recognition Vendor Test (Fvrt): Part 3, Demographic Effects, National Institute of Standards and Technology, 2019, p.5.
[7] 参见湖南省洪江市中级人民法院(2023)湘1281刑初158号刑事判决书。
[8] See Masi I, et al., “Deep Face Recognition: A Survey”, in 2018 31st SIBGRAPI Conference on Graphics, Patterns and Images IEEE, 2018.
[9] See Li L, et al., “A Review of Face Recognition Technology”, 8 IEEE Access 139110, 139110(2020).
[10] See Alghaili, et al., “Facefilter: Face Identification with Deep Learning and Filter Algorithm”, 2020 Scientific Programming 1, 1(2020).
[11] See Grother P, Ngan M & Hanaoka K, Face Recognition Vendor Test (Fvrt): Part 3, Demographic Effects, National Institute of Standards and Technology, 2019, p.4.
[12] 参见黄健:《刑事大数据证据现实论》,载《新疆大学学报(哲学社会科学版)》2023年第4期,第35页。
[13] 参见刘品新:《论大数据证据》,载《环球法律评论》2019年第1期,第22页。
[14] 参见王禄生:《论法律大数据“领域理论”的构建》,载《中国法学》2020年第2期,第259页。
[15] 参见洪涛:《大数据证据研析》,载《行政与法》2022年第3期,第83页。
[16] 参见周慕涵:《论大数据证据的法律地位》,载《法律科学》2023年第4期,第105页。
[17] 参见元轶:《大数据证据二元实物证据属性及客观校验标准》,载《山西大学学报(哲学社会科学版)》2021年第5期,第146页。
[18] 参见刘品新:《论大数据证据》,载《环球法律评论》2019年第1期,第22页。
[19] 参见谢君泽:《论大数据证明》,载《中国刑事法杂志》2020年第2期,第126页。
[20] 例如,有学者认为,大数据证据之实体仅指向最终形成的大数据分析报告,但其又在后文中将淘宝客反作弊系统数据、证券交易监控系统数据这些大数据集视为大数据证据一并讨论,有自相矛盾之嫌。参见周慕涵:《论大数据证据的法律地位》,载《法律科学》2023年第4期,第105-107页。
[21] See Boutros F, et al., “Synthetic Data for Face Recognition: Current State and Future Prospects”, Image and Vision Computing 104688, 104688(2023).
[22] See Grother P, Ngan M & Hanaoka K, Face Recognition Vendor Test (Fvrt): Part 3, Demographic Effects, National Institute of Standards and Technology, 2019, p.4.
[23] 参见谢君泽:《论大数据证明》,载《中国刑事法杂志》2020年第2期,第127页。
[24] 参见[英]理查德·梅:《刑事证据》,王丽、李贵方等译,法律出版社2007年版,第190页。
[25] 参见[美]约翰·W·斯特龙编著:《麦考密克论证据》(第五版),汤维建等译,中国政法大学出版社2004年版,第26页。
[26] 《高法解释》第88条第2款:“证人的猜测性、评论性、推断性的证言,不得作为证据使用,但根据一般生活经验判断符合事实的除外。”
[27] 参见广东省江门市新会区人民法院(2019)粤0705刑初587号刑事判决书。
[28] 参见李学军、朱梦妮:《意见证据制度研究》,中国人民大学出版社2018年版,第2页。
[29] 参见汪志刚:《德国法上的意见表达和事实陈述的区分》,载《北方法学》2011年第3期,第156页。
[30] 参见周慕涵:《论大数据证据的法律地位》,载《法律科学》2023年第4期,第106页。
[31] See Goodfellow I, Bengio Y & Courville A, Deep Learning, MIT Press, 2016, p.6.
[32] See Russell S J & Norvig P, Artificial Intelligence: A Modern Approach, Pearson, 2016, P.693.
[33] See Le Q V, “Building High-Level Features Using Large Scale Unsupervised Learning”, in 2013 IEEE International Conference on Acoustics, Speech and Signal Processing, 2013.
[34] See Holmes W & Miao F, Guidance for Generative AI in Education and Research, UNESCO Publishing, 2023, p.8.
[35] See Goodfellow I, Bengio Y & Courville A, Deep Learning, MIT press, 2016, pp.699-703.
[36] See Knight W, “The dark Secret at the Heart of AI”, 120(3) MIT Technology Review 54, 56(2017).
[37] See Charlotte A & Tschider, “Beyond the ‘Black Box’”, 98 Denver University Law Review 683, 690(2020).
[38] See Boutros F, et al., “Synthetic Data for Face Recognition: Current State and Future Prospects”, Image and Vision Computing 104688, 104697(2023).
[39] See Jones C & Bergen B, “Does GPT-4 Pass the Turing Test”, https://doi.org/10.48550/arXiv.2310.20216, accessed February 27, 2024.
[40] See Goodfellow I, Bengio Y & Courville A, Deep Learning, MIT Press, 2016, p.20.
[41] 计算机领域的术语“人工智能”指的是探索计算极限的理想目标(或反乌托邦的结果),其要求计算机在各种认知任务中与人类竞争或超越人类表现的能力,包括但不限于维持自身的能力(即向前繁殖的任务),see Grimm P W, Grossman M R & Cormack G V, “Artificial Intelligence as Evidence”, 19 Northwestern Journal of Technology & Intellectual Property 9, 15(2021).
[42] See Mahesh B, “Machine Learning Algorithms-a Review”, 9 International Journal of Science and Research 381, 381(2020).
[43] See Goodfellow I, Bengio Y & Courville A, Deep Learning, MIT Press, 2016, pp.20-24.
[44] See Schroff F, Kalenichenko D & Philbin J, “Facenet: A Unified Embedding for Face Recognition and Clustering”, in Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, 2015.
[45] 《高法解释》第100条:“因无鉴定机构,或者根据法律、司法解释的规定,指派、聘请有专门知识的人就案件的专门性问题出具的报告,可以作为证据使用。对前款规定的报告的审查与认定,参照适用本节的有关规定。经人民法院通知,出具报告的人拒不出庭作证的,有关报告不得作为定案的根据。”关于该条规定的专门性问题报告的研究,参见吴洪淇:《刑事诉讼专门性证据的扩张与规制》,载《法学研究》2022年第4期,第168-184页。
[46] 参见吴洪淇:《刑事诉讼专门性证据的扩张与规制》,载《法学研究》2022年第4期,第181页。
[47] See Karnow C E A, “The Opinion of Machines”, 19 Columbia Science and Technology Law Review 136, 140(2017).
[48] 《美国联邦证据规则》第701条规定:“普通证人的意见可以作为意见证据规则的例外,前提是这些意见是合理地基于该证人的知觉,有助于清晰理解该证人证言或者确定争议事实,并且不是基于第702条范围内的科学、技术或其他专门知识。”
[49] 《美国联邦证据规则》第702条规定:“在下列四种情况下,因知识、技能、经验、训练或者教育而具备专家资格的证人,可以以意见或者其他形式作证:(1)专家的科学、技术或其他专门知识将会帮助事实审判者理解证据或者确定争议事实。(2)证言基于足够的事实或数据。(3)证言是可靠的原理和方法的产物。(4)专家将这些原理和方法可靠地适用于案件的事实。第703条规定了专家意见证言的基础。”
[50] 《日本刑事诉讼法》第156条第1款规定:“可以让证人陈述根据其实际经历过的事实推测的事项;《日本刑事诉讼规则》第199条之13规定:“诉讼关系人不得进行下列询问:……(3)要求意见或者有关议论的询问;(4)对证人未曾直接经历的事实的询问。”
[51] [日]松尾浩也:《日本刑事诉讼法》(下卷),张凌译,中国人民大学出版社2005年版,第54页。
[52] 《世界各国刑事诉讼法》(欧洲卷 上),编辑委员会编译,中国检察出版社2016年版,第407页。
[53] 《刑事诉讼法》第147条:“为了查明案情,需要解决案件中某些专门性问题的时候,应当指派、聘请有专门知识的人进行鉴定。”《最高人民法院 最高人民检察院 公安部 国家安全部 司法部关于办理死刑案件审查判断证据若干问题的规定》第12条第3款:“证人的猜测性、评论性、推断性的证言,不能作为证据使用,但根据一般生活经验判断符合事实的除外。”
[54] 参见马贵翔、张海祥:《意见证据规则探析》,载《华东师范大学学报(哲学社会科学版)》2009年第2期,第63页;吴洪淇:《刑事诉讼专门性证据的扩张与规制》,载《法学研究》2022年第4期,第170页。
[55] 参见[美]约翰·W·斯特龙主编:《麦考密克论证据》(第五版),汤维建等译,中国政法大学出版社2004年版,第31页。
[56] 《刑事诉讼法》第146条:“为了查明案情,需要解决案件中某些专门性问题的时候,应当指派、聘请有专门知识的人进行鉴定。”
[57] 参见杨建国:《论科学证据可靠性的审查认定——基于判决书中鉴定结论审查认定的实证研究与似真推理分析》,载《中国刑事法杂志》2012年第1期,第119页。
[58] See Cino J G, et al., “The Oracle Testifies: Facial Recognition Technology as Evidence in Criminal Courtrooms”, 61 University of Louisville Law Review 137, 154(2022).
[59] 参见王燃:《大数据证明的机理及可靠性探究》,载《法学家》,2022年第3期,第69页;郑曦:《数字时代刑事证据开示制度之重塑》,载《华东政法大学学报》2023年第4期,第4页。
[60] See Roth A, “Machine testimony”, 126 Yale Law Journal 1972, 2028(2016).
[61] 参见马国洋:《论刑事诉讼中人工智能证据的审查》,载《中国刑事法杂志》2021年第5期,第175页。
[62] 参见沈伟伟:《算法透明原则的迷思——算法规制理论的批判》,载《环球法律评论》2019年第6期,第31页。
[63] See Verma A, Khatana A & Chaudhary S, “A comparative study of black box testing and white box testing”, 5(12) International Journal of Computer Sciences and Engineering 301, 301(2017).
[64] See Imwinkelried E J, “Computer source code: a source of the growing controversy over the reliability of automated forensic techniques”, 66 DePaul Law Review 97, 99(2016).
[65] See Wexler R, “Life, liberty, and trade secrets: Intellectual property in the criminal justice system”, 70 Stanford Law Review 1343, 1396(2018).
[66] See Bridgestone Ams. Holding Inc. v. Mayberry, 878 N.E.2d 189 (Ind. 2007).
作者简介
兰跃军 律师
兰跃军,北京市京师(上海)律师事务所律师,上海大学法学院教授,博士生导师,法学博士、博士后,主要从事刑事诉讼法、证据法、刑法、纪检监察学、被害人学等研究,兼中国刑事诉讼法学研究会理事、中国行为法学会理事、中国伦理学会法律伦理专业委员会常务理事、上海市律师协会第十二届刑诉法与刑事辩护专业委员会委员等。曾任上海市宝山区人民检察院副检察长、上海大学法律事务办公室主任等。擅长办理:刑事辩护(诈骗等经济犯罪、贪污贿赂等职务犯罪、信息网络犯罪、走私犯罪、毒品犯罪、侵犯知识产权犯罪、性侵害犯罪等)、刑事控告、刑事申诉、被害人代理,合同纠纷、建筑工程纠纷、知识产权纠纷等,担任独立董事。
来源:京师珠海律所