摘要:本文针对检察机关开展数字检察工作时未重视使用数据分析方法,导致模型准确性下降、可解释性不强以及适用性受限等问题,结合清远检察机关的实践探索具体分析数字检察中几种常用的数据分析方法,以期帮助检察机关建立更为有效的法律监督模型,同时为其他领域的大数据应用提供参考和
浅析数据分析方法在数字检察中的应用
巫飞燕、侯巍冰、张琛
摘要
本文针对检察机关开展数字检察工作时未重视使用数据分析方法,导致模型准确性下降、可解释性不强以及适用性受限等问题,结合清远检察机关的实践探索具体分析数字检察中几种常用的数据分析方法,以期帮助检察机关建立更为有效的法律监督模型,同时为其他领域的大数据应用提供参考和借鉴。
关键词:数字检察 数据分析方法 组合使用
随着信息技术的迅速发展,大数据已经在各行各业中得到了广泛应用。检察机关作为法律监督机关,也积极开展数字检察工作,以更好地履行职责。然而,一些检察机关在建立大数据法律监督模型时,没有充分运用科学的数据分析方法,可能会影响到模型的准确性和效率。因此,本文将探讨这一问题的现状和带来的问题,并结合清远检察机关的实践探索具体分析数据分析方法在数字检察过程中的应用。
一、现状及问题分析
目前,一些检察机关在开展数字检察工作时,往往只注重数据采集和模型构建,而忽视了数据分析的重要性。这主要表现在以下几个方面:一是数据质量不高。由于数据采集过程中缺乏有效的质量控制手段,导致采集到的数据存在误差和缺失,从而影响到后续的模型构建和分析。二是缺乏数据分析方法。一些检察机关在构建大数据法律监督模型时,没有充分运用数据分析方法,如聚类分析、关联分析等,导致无法从海量数据中快速比对、碰撞,挖掘出更有价值的线索和规律。三是数据分析人才匮乏。目前,一些检察机关缺乏专业的数据分析人才,这使得他们在处理大数据时显得力不从心。同时,由于缺乏有效的培训机制,导致数据分析能力无法得到有效提升。
缺乏数据分析方法会给检察机关的数字检察工作带来诸多问题。具体表现在以下几个方面:一是模型准确性下降。没有运用数据分析方法,就无法对数据进行深入挖掘和处理,导致模型准确性下降,甚至会出现误判和漏判的情况。二是模型可解释性不强。缺乏数据分析方法,会导致模型的可解释性不强。也就是说,模型得出的结论可能无法让人信服,从而影响到模型的公信力和可推广性。三是模型适用性受限。由于没有充分运用数据分析方法,导致模型无法对海量数据进行全面分析和处理,从而影响到模型的适用性和泛化能力。
二、数据分析方法在数字检察中的具体应用
5W2H、SWOT、PEST,这些常用于市场领域的数据分析方法,看似与检察工作没有交集,实际上,在数字建模的前期,如锁定建模领域、评估建模必要性和可行性,以及后续模型设计、施行全过程中,通过选择恰当的分析方法,能帮助更全面、精准地发现问题、分析问题、解决问题。为了实现模型效用的最大化,可以在同一个模型中综合多种数据分析方法,形成独特的组合策略,更好地挖掘数据背后的价值,为模型构建提供更全面、更准确的分析结果。
常用于检察机关建立大数据法律监督模型过程中的数据分析方法和思考路径如下:
(一)5W2H分析法
5W2H分析法,也被称为“七何分析法”或“七问分析法”。它代表了七个方面的问题,分别是:为什么(Why)、什么事(What)、什么人(Who)、什么时候(When)、什么地点(Where)、怎样(How)、多少(How much)。
在运用5W2H分析法时,通常是通过设置这七个方面的问题来进行预设、发现和解析问题,从而找到问题的最优解。需要注意的是,这七个方面的问题应与模型密切相关并且考虑周全,否则可能会偏离方向,无法达到预期评估目的。
5W2H分析法可以被广泛应用于开展数字建模的全过程。例如,在决定针对某个常见犯罪类型建立监督模型时,可以通过5W2H所代表的七个方面进行研判,以便更好地提炼要素特征和规律,为数字检察模型的建设提供基础支持和引导,提高建模的精度和效率。具体应用建议从以下方面进行设问:
1.什么事(What):建模想解决什么问题?预期的建模目标是什么?
2.为什么(Why):拟建模领域为什么会高发社会不良现象、违法行为甚至犯罪行为?原因可以归结为哪些方面?
3.什么人(Who):问题集中发生在哪些人身上?需要对哪些对象进行分析、监督?谁能提供建立模型所需的数据?需要哪方面只是领域的人力、如何分配来推进模型?
4.什么时候(When):需要研究的行为或现象发生有无时间规律?模型建立需要收集哪些时段的数据?建模需求是否急迫?建模周期如何规划较为适宜?
5.什么地点(Where):需要研究的问题有无地域特征?是否涉及跨区域跨领域的问题?需要在哪个层级研究和解决问题?
6.怎样(How):如何寻求问题的解决思路、应用工具、外力支援?如何找到模型构建的切入口径、融合路径?如何探索模型建设的效率最快化、效果最大化方法?
7.多少(How much):建立的模型要做到什么程度?能否和其他多个模型进行集约化、体系化升级?需要投入多少人力物力,可否实现高产出监督效能?
以阳山县检察院构建烟花爆竹行业整治类案监督模型为例。在岁末年初之际,阳山县检察院发现阳山县某烟花爆竹零售商户存在违规销售烟花爆竹的情形。于是,阳山县检察院使用5W2H分析法对问题进行解构:
为什么会出现这种情况(Why)?最可能的原因是相关监管部门存在履职不到位的情况。预设目标(What)是推动辖区内烟花爆竹行业系统治理。为了实现这个目标,阳山县检察院需要锁定问题人员。经研判,将目标锁定在烟花爆竹零售商户(Who),并设想通过相关行政机关、商户和政府门户网站获取模型需要的数据。经初步调查,整个阳山区域(Where)均可能出现较多同类问题,应与同级行政机关和政府共同研究解决问题,且即将到达烟花爆竹销售旺季,需要尽快建模,并在还没出现严重事故的时间节点(When)抢先开展工作。阳山县检察院还设想,在通过建立模型筛查线索的同时,可以通过综合运用调查核实、公开听证、宣告送达检察建议等工作方式(How),联合公益诉讼检察与行政检察“双驱动”监督来督促有关行政机关依法履职。关于模型要做到什么程度以及需要投入多少人力物力的问题,经过评估,阳山县检察院认为可以借助协作机制调取相关数据,并利用电子表格等免费工具来获取技术支持,只需投入较少的人力物力就能进行数据清洗、碰撞,即能快速发现线索,实现对涉烟花爆竹全链条违法犯罪行为进行打击(How much)。同时,还可通过本院多部门融合履职并与相关行政机关凝聚合力,推进全域治理,消除安全隐患。
(二)SWOT分析法
SWOT分析法,也被称为“态势分析法”“优劣势分析法”等,是评估一个项目或策略的重要工具。S代表优势(Strengths)、W代表劣势(Weaknesses)、O代表机会(Opportunities)、T代表威胁(Threats),优势和劣势主要是指内部的,机会和威胁主要是指外部的。这种分析方法可以帮助决策者全面地了解项目的内外部环境,以便做出科学的决策。
在运用SWOT分析法时,需要先客观地评估自身的优势和劣势,然后通过调查、核查等手段了解与项目或策略密切相关的外部机会和威胁。只有将内部和外部因素进行综合、系统地分析,才能得出准确的评估结果。需要注意的是,不能只看到劣势和威胁,而轻易放弃项目;也不能过于乐观地看待优势和机会,而忽略潜在的风险。
SWOT分析法可以应用于数字建模的全过程,特别是在前期锁定建模领域、评估建模必要性和模型实施的可行性方面。S、W、O、T并非固定不变的,它们会随着客观环境的改变和主观能动性的发挥而发生动态变化。劣势和威胁也可以被转化为优势和机会,这种转化过程需要检察人员具备敏锐的洞察能力和灵活的应变能力,以便因势利导,在不断变化的环境中保持良好的行动力、监督力。SWOT分析法可以从以下内容进行思考:
1.优势(S):在考虑自身的优势时,需要关注与待建模型密切相关的数据、技术、人才等方面。如人力资源配备,检察官在哪个领域较为擅长;如技术力量,是否存具备相应技术可以用于模型数据的获取、清洗或碰撞;如外部协同,是否已和相关行政机关联签了机制,便于获取模型需要的数据等。
2.劣势(W):在考虑自身的劣势时,需要关注资源壁垒、技术限制、地域跨度等方面。如检察机关在构建模型所需的数据获取、线索核查等方面是否有足够的人员和资源?是否有能力对数据进行解构,并保障数据的安全性?涉及专业领域的是否具备相应的知识储备?跨区域案件是否能够获得当地相关单位的支持等。
3.机会(O):在考虑外部机会时,需要关注待建模型是否具有必要性,以及模型推行后可能带来的法律监督成效和社会综合治理效果。例如,待建模型是否能够填补现行监督的空白?是否能够发现批量监督线索?
4.威胁(T):在考虑外部威胁时,需要关注建立待建模型推进过程中可能存在的问题、障碍和负面影响。例如是否与相关政策或规范性文件相冲突?是否可能遇到行政机关和企业的抵制?是否可能触动群体性利益?是否可能引发舆情风险等。
如清远市检察院建立的KTV被诉侵犯著作权批量恶意诉讼法律监督模型,监督的是部分商业主体利用著作权登记和法院裁判规则漏洞,在全国范围内进行大规模恶意诉讼,甚至伪造权属证据进行虚假诉讼的严重扰乱版权市场秩序行为。在该模型构建初期,模型创建团队运用SWOT分析法对模型的可行性进行了深入研判。研判内容如下:
该模型优势(S)首先在于清远检察机关近年对知识产权保护工作的高度重视。清远检察机关在2021年就已进行知识产权检察集中统一履职探索,率先在清城区检察院设立了广东省首个“四大检察融合履职”的知识产权检察办公室,此后分别在清远市检察院设置知识产权检察办案组,在各基层院培育知识产权办案骨干,打破内部刑事、民事、行政和公益诉讼检察条线壁垒,构建“上下一体、区域联动”的一体化办案模式。其次在于清远检察机关的坚实技术基础。配备了可查询、检索、分析裁判文书的“小包公·法律AI”平台,开通了专业版天眼查等平台账号,模型需要的大部分数据可通过公共渠道获取,并进行有效数据预处理和整合。
该模型劣势(W)在于知识产权领域专业性强,检察机关在此方面的探索较浅,专业人才仍然不够充足,需要边干边学,最终能否突破模型推行过程中遇到的瓶颈困难存在诸多不确定性。
该模型外部优势(O)是强化知识产权保护高度契合国家经济社会发展战略布局,不论是上级检察机关还是国家版权局、中国音像著作权集体管理协会均对该项工作给予大力支持和指导,很大程度上可以弥补检察机关在专业领域的劣势。同时,该模型如果能成功运行,也将为知识产权保护这个新兴领域提供检察样板,以小切口推动大治理,为知识产权强国战略贡献检察力量。
该模型外部威胁(T)在于涉案人员多、涉案范围广、触动利益大,调查取证存在极大困难,且办案过程中可能会受到阻挠。
模型创建团队通过SWOT分析法综合论证后认为,该模型S(优势)和O(机会)极占优势,W(劣势)和T(威胁)则可以通过内部攻坚和外部支持解决,W和T在后期还有转变为S和O的可能性。比如随着调查取证的推进,涉案人员多也意味着突破点多,版权意识觉醒也将进一步消除阻滞力量。通过SWOT分析法坚定了清远检察机关创建模型的信心,而事实也证明,该模型不但可行,而且成效明显,在全国检察机关大数据法律监督模型竞赛中荣获二等奖。
(三)PEST分析法
PEST分析法,也被称为“外部环境分析法”,是一种全面、系统的外部环境分析方法,用于解析外部环境中的政治、经济、社会和技术四大方面的影响因素。
在具体应用PEST分析法时,首先需要对政治、经济、社会和技术四个方面的影响因素进行全面的总结和罗列,再通过系统思维进行分析,以便精准判断外部环境的现状和可能的发展趋势,再结合自身情况综合评估做出决策。需要注意的是,单独使用PEST分析法评估外部环境情况并不能直接作出决策,因此通常需要结合SWOT分析法使用,以作为SWOT分析法中评估外部机会(O)和威胁(T)的具体细化分析方法。同时,通过结合SWOT分析法中优势(S)和劣势(W),可以形成最终的决策。
通常在建模初期,需要使用PEST分析法来评估建模的必要性和模型推行的可行性。而在模型推进过程中,根据外部环境不断的变化调整模型的走向也是必要的。具体建议如下:
1.政治(Politics):要关注国家的制度、政策和法律法规等,同时也要关注和政府、政府相关部门的关系。在建模时,需要考虑待建模型是否符合国家的制度、政策、法律法规?在个案中发现问题后,从法律法规再出发,可以找到哪些可行的监督点?拟解决的问题产生的缘由是否和政策相关?监督的方向和政府、相关部门的大局、方针政策是否一致?可以从哪方面开展法律监督工作,实现良好的政治、法律效果?
2.经济(Economy):包括国民收入、GDP等国家经济发展情况等宏观经济,也包括当地的经济发展水平、就业情况、收入水平等微观经济。具体建模时,需要考虑待建模型地区的微观经济情况,思考拟解决的问题产生的缘由是否和当地经济相关?可以从哪方面开展法律监督工作,实现助推当地经济发展、优化企业营商环境的目标?
3.社会(Society):包括人口结构分布、社会文化、教育水平、收入分布、价值观、道德观和社会习俗等方方面面。具体主要考虑待建模型解决的问题成因是否与社会因素相关?建模方向有无和社会价值观、道德观及当地习俗相冲突?可以从哪方面开展法律监督工作,实现良好的社会效果?
4.技术(Technology):技术环境主要指外部技术环境。具体主要考虑待建模型的数据能否通过外部互联网、第三方机构、社会企业、成熟的技术平台进行数据提取、数据碰撞?模型构建所需要的技术手段是否具有可行性等。
以连山县检察院的涉林领域综合监督模型为例。他们运用PEST分析法进行了深入分析。连山县地处南岭五岭之一的萌诸山脉之中,峰峦林立,全县林业用地面积超十万公顷,森林覆盖率高达85%以上。然而,当地属于经济欠发达地区(E),人均年收入较少,部分当地群众文化程度较低,法律意识淡薄(S),犯罪动机多为获得经济利益。近年国家大力提倡生态环境资源保护,当地滥伐林木现象较为突出,亟待整治(P)。通过PEST分析法的运用,连山县检察院因地制宜,将破坏生态环境资源的违法犯罪行为纳入监督重点。同时,连山县检察院目前在编干警仅26人,受限于人力、经费,以往靠两条腿一张嘴的线索获取途径已无法适应监督需要,应借助科技力量如卫星巡查、行政执法与刑事司法信息共享平台、中国裁判文书网、“小包公·法律AI”平台(T)等快速获取模型需要的数据,通过数据碰撞锁定监督线索。基于上述分析,连山县检察院创建了滥伐林木大数据法律监督模型,极具当地特色,又充分展现了检察担当。
(四)逻辑树分析法
逻辑树分析法,又称为“问题树”“演绎树”“分解树”分析法,是一种先确定总问题或总目标,再通过逐步分解问题或分解任务,然后削减细枝末节,锁定关键点进行系统分析,从而找到解决问题的方案或制定可行性强的计划的分析方法。逻辑树分析法是数据分析时最基础的分析方法之一,被广泛运用于各行各业各环节。
在应用逻辑树分析法时,首先要将需要解决的总问题和总目标分解为多个具体的、相互独立的问题。在锁定关键点时,要剔除不重要、次要的小问题,集中精力对关键点进行深入分析。最后,根据系统分析的结果,制定解决问题的方案或可行性强的计划。需要注意的是,对于简单问题,不需要使用逻辑树分析法,以避免将问题复杂化。
逻辑树分析法可以被广泛应用于检察机关开展数字建模的全过程中,特别是在模型设计阶段。通过运用逻辑树分析法,检察机关可以系统地分析建模需要解决的问题,并演绎、策划模型执行时的全流程即数据获取、清洗、碰撞和线索复核、具体监督方式等。
例如,英德市检察院在探索建立公安派出所执法活动大数据法律监督模型时,发现公安派出所执法活动十分复杂,如果无重点无差别地进行全面监督,现有资源无法实现,需要更为精细化地确定在哪些方面进行集中投入,用最少的资源和人力,达到最佳的监督效果。为此,英德市检察院采用逻辑树分析法,首先对巡回监督派出所专项活动中发现的问题和侦查监督平台记录的问题,进行全面汇集,制作了《对派出所巡回监督问题清单》。接下来,将清单中的问题按照刑事、行政、执行等条线进行分解,再对各条线问题层层拆细,直到发现主要问题、常见问题。最终,有针对性地确定了五个重点监督方向,包括刑事挂案问题、剥夺政治权利执行问题、涉案财物处理问题、犯罪记录封存问题以及行政案件超期办理问题。按照逻辑树分析法的思路,找准了痛点,抓准了堵点,剔除了次要问题。这不仅有助于提高监督效果,还能够节省人力和物力资源,实现最佳的监督效果。
(五)帕累托分析法
即经典的二八定律,指在任何一组事物中,最重要的只占其中一小部分,约20%,其余80%尽管是多数,却是次要的。世界上80%的财富由不足20%的人拥有、企业80%的销售额是由20%的产品或客户贡献的,上述现象都暗含帕累托定律。帕累托分析法在数字检察中的应用,可理解为20%的数据能够产生80%的监督效果。问题的核心在于如何在海量数据中挖掘这20%的数据,进一步体现在如何挖掘建模的“小切口”、如何锁定模型所需最可能生成线索的“异常数据”。
1.对建模方向的限缩。模型的创建可以围绕违法犯罪问题多发高发的20%领域出发,进而获取最大的建模效益。如在行政处罚领域进行建模,可以先行考察哪些领域的行政处罚手段更为严厉或行政处罚案件量较多,那这些领域出现执法乱象的可能性就更高,监督的效果可能更为突出,群众的获得感也可能更强。
在连南县检察院的督促整治高龄津贴监督模型中,连南县检察院关注到,国家有关津贴、补贴的发放一般具有相应的条件或时限,一旦不符合条件或超出时限的,即应当及时停发,否则不仅会背离救助、扶助制度的初衷,更会造成国有财产的流失。连南县检察院通过对有关津贴、补贴项目的规定和发放情况进行梳理和调研,发现高龄津贴存在发放范围广(达到80岁以上年龄要求即可申领)、发放总额高、部分老人领取年限达十余年等问题,可能存在应停发未停发等发放乱象。连南县检察院以高龄津贴为切入点进行排查,通过对领取人员信息和辖区已死亡人员信息进行比对,发现存在已死亡人员名下仍存在领取高龄津贴记录的漏洞,通过数字建模推动行政机关追缴流失的国有财产。该模型的创建和应用也为后续开展其他津贴、补贴类的排查和监督提供了范本。
2.对案件线索的限缩。即通过设置条件锁定具有较高价值密度的案件,将排查范围锁定在最有可能成案的部分线索。如在开展民间借贷虚假诉讼监督中,可以通过对批量案件的原告、被告、诉讼标的额等关键要素进行解构,将攻坚范围初步锁定在同一原告出现频率最高的20%案件。剩余的案件虽然也可能存在虚假诉讼问题,但可能作案手段更为多样,线索排查更为困难,价值密度不高,可在阶段性成果取得后再行梳理。
在清城区检察院的交通事故保险理赔虚假诉讼监督模型中,检察机关对案由为机动车交通事故责任纠纷进行信息提炼,对诉讼代理人、鉴定机构、保险公司、理赔金额、伤残等级等要素出现的频次进行分析,将排查范围锁定在部分代理人、司法鉴定机构、保险公司出现频率畸高的案件。进而通过收集银行流水、人员关系、社保数据、医保数据等信息,对上述高频出现的代理人、司法鉴定机构、保险公司等进行人工全面分析,结合相关侦查手段,有效发现涉案人员伪造工作证明、在医院挂空床、提供虚假鉴定等虚假诉讼案件线索。
(六)画像分析法
画像分析法,也被称为“用户画像”,是一种在目标需求的基础上,通过有针对性地收集相关人群的身份信息、习惯偏好、场景行为等标签数据,然后进行深入地分析与研判,以锁定最符合目标需求的对象群体的分析方法。
在运用画像分析法时,首要步骤是明确目标需求。只有确定了具体的目标需求,才能确保画像分析的针对性和有效性。如果目标需求模糊不清,可能会导致画像分析的结果缺乏实际应用价值。第二步是收集与目标用户相关的各种数据。这些数据可能包括身份信息、行为习惯、偏好、所处行业特性、社交媒体使用情况等多个方面。通过对这些数据进行深入挖掘和分析,可以更加全面地了解目标用户的特征要素。第三步是进行数据清洗和整合。在这个过程中,需要筛选出与目标需求密切相关的数据,同时将各种数据源进行梳理和分析。这有助于将各种信息整合成一份较为完整的用户画像,初步锁定符合目标的对象。通常,还需要在实践中对初步形成的画像进行测试和验证。只有那些经得起实践检验的画像才能真正符合目标需求,为后续的决策提供有价值的支持。
通过运用画像分析法,检察机关可以更加深入地了解和掌握涉案人员的类型化特征,为追捕追诉漏犯提供更加精准的数据支持。
例如,在清远检察机关涉及毒品和“两卡”(银行卡和电话卡)犯罪的模型中,以监督立案和追捕追诉漏犯为目标,通过收集全市同类相关案件的涉毒、涉“两卡”人员的绰号、身份证信息、手机号、社交软件账号、收付款账号、银行转账情况和相关联聊天记录等信息,形成基础数据库。接着,通过对这些信息进行深入分析和研判,形成疑似漏犯类型化指征,运用技术手段对符合类型化指征的漏犯线索进行推送。最后,由检察官对线索进行复核和确认。后期还可以通过将具体的个案疑似漏犯信息与数据库中成功画像的疑似漏犯人员信息进行分析、碰撞,从而测试是否系具体“目标对象”即漏犯。这样可以帮助检察机关更加迅速、精准地锁定犯罪嫌疑人,提高案件侦破的效率和准确性。
(七)关联分析法
“关联分析法”也叫“相关性分析”“相关思维”,是将不同数据进行关联,并挖掘二者之间联系的分析方法。数字检察的本质是对海量数据进行深度挖掘和关联分析,破题要义就是找到数据之间的关联点。因此,关联分析法在数字检察中被广泛应用,它既是最基本的数据分析方法,也是最核心的数据分析方法。
在数据分析过程中,关联分析法常常与其他数据分析方法结合使用,主要用于以下方面:
1.关联法律法规:是指通过对不同法律法规条款之间的关联性进行分析,可以更全面、更准确地理解法律规定,提高法律适用的准确性。在数字检察中,关联法律法规主要用于监督点的发掘,即通过将不同的法律规定进行串联,从而发现有数据可提取、可进行碰撞的监督方向。
如清新区检察院的企业恶意注销行政非诉执行法律监督模型,就是基于对以下规定进行关联生成模型的监督逻辑:《公司法》及相关司法解释中规定公司注销前应当清偿完毕债务,因此,可通过对公司注销的信息与行政处罚信息进行比对,排查公司在注销前仍有未执行完毕的行政处罚债务的违法点。根据《公司法》及相关司法解释中对于有限责任公司股东骗取公司登记机关办理法人注销登记的责任承担,可以通过排查涉案公司的股东信息确定责任承担人。《最高人民法院对的答复》等规定明确了法院应当如何处理该类案件,为数字建模提供了出路。
2.关联案件线索:是指从不同角度和层次发现和寻找数据之间的关联性和规律性,以便找出关联发生的原因、手段和目的,进而挖掘出潜在的案件线索。在数字检察工作中,可以通过设置一定条件从海量数据中将相关数据串并起来,寻找相关数据之间的共通点,进而判断是否存在异常。
如清城区检察院创建的追索劳动报酬虚假诉讼监督模型即出自对关联线索的梳理。清城区检察院在办理刘某某与A公司追索劳动报酬纠纷案中发现,该案存在刘某某主张其入职两年多以来未领取过任何工资、A公司未出庭应诉却认可刘某某全部诉讼请求等异常。清城区检察院即以“A公司”为关键词,从中国裁判文书网中排查发现同一时期以该公司为被告的追索劳动报酬纠纷多达12件。清城区检察院后续运用画像分析法对该批关联串案线索进行深入核查,查实后通过提请抗诉或向法院发出再审检察建议等方式,成功办理一批民事生效裁判监督案件。
3.关联社会信息:是指通过分析涉案人员的职业或收入来源、社交媒体、资金往来等社会信息,了解其社会背景和人际关系,为判断其犯罪动机和行为模式提供帮助。在数字检察中,检察机关可以通过不断提炼案件信息进行数字画像,假设频繁出现的数据之间可能存在相关,继而求证该相关性的真伪。对涉案人员的社会信息进行关联,通常在挖掘虚假诉讼线索或团伙犯罪线索中十分有效。
如上述追索劳动报酬虚假诉讼监督模型中,清城区检察院通过“天眼查”平台对被告A公司法定代表人李某某名下公司进行筛查,发现其经营的多家公司信息,形成数据比对库一。通过社保部门调取各原告的社保缴纳信息,发现部分原告有缴纳社保,提取付款人信息,形成数据比对库二。通过两个数据比对库的碰撞,筛查出部分原告有在被告公司法定代表人李某某经营的其他公司任职的线索。至此,李某某利用破产清算过程中劳动债权具有优先受偿权的规则,组织员工提起虚假追索劳动报酬诉讼,借此逃避其他债权执行的违法路径浮出水面。
4.关联案件证据:关联分析法在证据关联上的体现,主要是通过对证据进行整合,进而解析证据之间的逻辑关联,以及证据与待证事实之间的逻辑关联。不同证据之间的关联,既可以是起补强作用的正向关联,也可以是针对同一待证事实相互矛盾的反向关联,帮助确定变量之间的联系,这一过程比单纯按照证据种类罗列证据更有助于证明或还原案件事实,特别是潜在因果关系方面的事实。因此,关联分析法常用于调查、侦查、自行补充侦查。
以刘某某等人串通投标案为例,为查明各投标人之间是否有串通投标,除言词证据外,也需要找出电子数据、书证等证据间的关联性予以印证。侦查机关提取了不同投标公司的电脑、U盘中的电子数据,检察官经过比对分析,发现同一招投标项目有多个投标公司标书电子文档的“作者”同一,系在同一台电脑制作,有力证明了串通投标事实。
(八)对比分析法
对比分析法就是对两组或两组以上的数据进行比较,来准确、量化地分析这些数据之间的差异。对比分析法是一种基础的数字分析方法,在经济学领域,这种分析方法的核心目标是找出差异产生的原因,从而找到优化的方法。但对比分析法运用在数字检察中的目标并不限于寻找原因,更重要的是通过数据的对比进行清洗,缩小排查范围,推送监督线索,证明案件事实。
较为常用的对比分析法包括:
1.纵向比较法:即对同一总体条件下不同时期的指标数值进行比较,从而揭示事物的发展变化过程和规律。在数字检察中,纵向法主要用于通过对比某一事物在不同时期是否存在变化,据此判断相关违法行为是否存在或是否得以消除,这种分析方法在公益诉讼检察中的运用较为普遍。如在办理非法占地类的公益诉讼案件中,对于要求违法行为人采取复耕复绿、退耕还林等修复措施的监督案件,可以通过比较同一地块在不同时期的卫星影像图,直观地查看整改效果,以此判断行政机关是否存在怠于履职行为。
在清远市检察院的督促依法监管超范围、超量采矿等涉矿类案监督模型中,纵向比较法的运用效果尤为突出。为确定相关矿山企业非法采矿开始时间及涉案矿区地物变化,清远市检察院向中国科学院空天信息创新研究院(以下简称“空天院”)申请使用具有覆盖范围全面、真实客观和历史过程可追溯等独特优势的卫星遥感技术,以相关采矿许可证载明的矿区范围拐点坐标确定遥感监测范围,获取案涉地遥感影像资料、2013年5月至2022年3月坐标范围周边50米地物变化监测资料,通过卫星遥感历史影像比对确认案涉地已发生超越矿权界限开采的基本事实。空天院还通过全国检察公益诉讼工作遥感信息分析取证平台智能输出遥感监测分析报告,为检察监督提供直接可读的结论性科学支撑。
2.横向比较法:横向比较则是通过选择同一时间条件下不同地区或单位的指标数值作比较,以此来揭示各地区或单位间的差异。在数字检察中,横向比较法可应用于通过对比同一事物在不同区域中的差异,达到锁定异常点的效果。比如,在水体污染防治公益诉讼案件中,仅靠肉眼可能难以锁定污染源头,通过对不同水段采取水样检测、多光谱无人机水体污染巡检等方式,便可判断污染程度,科学、准确排查污染源头。
在清城区检察院办理的督促保护某湿地公园行政公益诉讼案中,横向比较法发挥了关键作用。为查实该湿地公园是否存在水体污染问题,检察机关利用无人机搭载可见光/多光谱双光相机采集湿地湖面全域水体信息。数据采集后,通过专业软件基于不同的波谱曲线与特征生成数字正射影像、多光谱影像以及NDVI指数图等处理数据,直观反映湖面污染水体的颜色差异、水面漂浮物等目标。通过污染水体的颜色差异,锁定湿地公园湖面水体存在排污管道污水流入问题,并计算得出污染面积约为733平方米。清城区检察院督促相关行政机关及时整改,投入1000万元对湖区周边污水主管道进行修复。
3.标准比较法:是指将某个指标数据与一个标准值或理论参考值进行比较,以评估该指标数据的表现或差距。在数字检察中,标准比较法可应用于通过行业标准或公式计算得出标准值、理论参考值与实际值的比对,考察实际值是否存在异常,进而列为监督线索。比如通过公式计算产出一吨预搅拌水泥理论上应该使用的水量属于理论参考值,通过调取企业的销售吨数和用水数据计算得出该企业产出一吨预搅拌水泥的用水量属于实际值,进而将实际用水量和理论用水量进行对比,排查企业是否存在非法取水的监督线索。
例如,在连州市检察院的生猪养殖违法取水类案监督模型中,根据相关规定圈养畜禽饮用月取水量200立方米(经换算约为200000升)以上的养殖场,需要办理取水许可证。根据《广东省用水定额》标准,饲养一头生猪每日的用水定额先进值为30升。据此,饲养超过223头生猪的养殖场每月理论用水量一般会超过200立方米,需要办理取水许可证。连州市检察院通过调取辖区养殖场的生猪养殖清单,筛查出养殖生猪数量大于223头的养殖场,根据其实际养殖数量推算其理论用水量,再与调取的用水数据、取水许可证清单进行比对,可精准锁定非法取水养殖场。
(九)分组分析法
分组分析法是指根据数据的性质、特征,按照一定的指标,将数据总体划分为不同的部分,分析其内部结构和相互关系,从而了解事物的发展规律。在数字检察中,分组分析法往往与对比分析法等结合使用,在总体中将不同性质的对象分开,再进行差异性分析。根据指标的性质,分组分析法分为属性指标分组和数量指标分组。
如清新区检察院的看守所混押混管法律监督模型中,首先对看守所在押人员按关押的仓号进行第一梯次的分组,生成每个仓的在押人员数据。然后对同仓在押人员开展三个维度的第二梯次分析,第一维度是根据在押人员的涉案案号进行分析,排查是否存在同案犯混押的情形;第二维度是根据在押人员的年龄进行分析,排查是否存在未成年人与成年人混押的情形;第三维度是根据在押人员涉案案件的诉讼阶段进行分析,排查是否存在已决案件人员与未决案件人员混押的情形。
三、结语
数字检察是新时代检察机关革命破局之“道”,数据分析方法则是其中的“术”。术专,方能得道。只有更好地掌握数据分析方法,才能不断提高分析的精度和效率。因此,我们应该高度重视数据分析方法的研究和应用,更好地实现数字检察的价值和目标。
来源:牡丹区人民检察院