数字正当程序:网络时代的刑事诉讼
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

三、大数据与刑事正当程序的冲突

大数据在服务于查明案件事实这一实体性刑事司法价值时所引发的刑事司法活动的变化,不仅仅反映在具体法律规定的适用层面,同时也在更深层次上对刑事正当程序的一系列基本原则形成挑战。具体而言,这种挑战主要体现在三个方面:一是犯罪治理提前启动与无罪推定原则的冲突,二是数据赋能与控辩平等原则的冲突,三是第三方介入与权力专属原则的冲突。

(一)犯罪治理提前启动与无罪推定原则的冲突

大数据介入刑事司法导致犯罪治理提前启动,一方面体现在犯罪预测将应对犯罪的模式由被动转为主动,由事后打击转向事前预防;[67]另一方面则体现在具体刑事案件调查取证过程中,刑事侦查权的扩张和溢出。

大数据与无罪推定原则之间的冲突由此产生。我国《刑事诉讼法》第12条规定“未经人民法院依法判决,对任何人都不得确定有罪”。联合国人权事务委员会第32号一般性意见指出,“无罪推定是保护人权的基本要素,要求检方提供控诉的证据,保证在排除所有合理怀疑证实有罪之前,应被视为无罪,确保对被告适用无罪推定原则,并要求根据这一原则对待受刑事罪行指控者。所有公共当局均有责任不对审判结果作出预断,如不得发表公开声明指称被告有罪”[68]

据此,无罪推定原则一方面从正面确认审判前被指控人应被推定为无罪,另一方面则从反面对审前预判以及基于该预判而限制公民基本权利的行为作出否定解读。这种否定解读一直与审前保安性质的措施之间存在紧张关系,核心问题在于基于风险考量,对于尚未形成刑事诉讼法意义上的犯罪或犯罪嫌疑的特定主体,是否以及在何种程度上可以对其基本权利进行限制。[69]“9·11”之后,这种紧张关系在打击恐怖主义犯罪等严重威胁国家及公共安全的犯罪方面呈现出向强化犯罪控制方向倾斜的趋势。[70]在我国,这种趋势也反映在《反恐怖主义法》第五章关于调查的规定和《国家安全法》第28条关于反恐工作的规定之中:基于可能存在的恐怖主义犯罪风险,公安机关可以采取盘问、检查、传唤、提取或采集人体生物识别信息和生物样本、询问、调取收集材料、查询、扣押、冻结资产、不超过三个月的约束措施等调查措施。

尽管保安措施以及审前强制措施与无罪推定原则之间的紧张关系一直存在,但个人信息大数据的应用使得这种紧张关系开始由极特殊的犯罪类型扩张为一般犯罪案件。再以警务预测实务为例,北京市怀柔警方的预测系统目前主要针对盗窃类案件;苏州犯罪预测系统2015年就已经覆盖了91种违法犯罪行为,[71]2016年又搭建起“非法集资预测预警处置平台”;[72] 江西省的特殊人群大数据平台针对包括服刑人员、刑满释放人员、戒毒人员和社区矫正人员在内的47万余人。[73]

犯罪预测以及由此触发的后续治理措施在目标人员和目标犯罪两个层面的一般化趋势,意味着犯罪风险防控的预防性措施与无罪推定原则之间的冲突已经由例外转向常规。如果说针对恐怖主义犯罪风险采取突破无罪推定原则的措施是“不得不为”的无奈之举,那么基于大数据进行的这种常规化犯罪风险控制则是遵循“可以为”的思维逻辑。

此外,研究表明,大数据在助力犯罪侦查并补强立案依据的同时,还会在一定程度上强化有罪推定的假设。[74]加拿大法与科技学者伊恩·科尔(Ian Kerr)和杰西卡·埃尔勒(Jessica Earle)指出,大数据的应用机理在于预测,凡预测必存在预期。[75]这一点在经济领域较为明显,例如大型网络搜索引擎通过大数据技术编辑搜索结果,从而引导其用户的网络浏览行为。[76]

在风险社会的大背景下,大数据的预测功能首要服务于打击犯罪而非保障公民基本权利。侦查人员在案发之初凭借经验和逻辑推理形成假设,用于指引取证活动,并根据搜集到的证据碎片进行反复修正,最终形成完整的排除内在矛盾的证据链条,这种做法符合一般的侦查逻辑。但目前大数据多用于建立或强化有罪链条,执法人员在运用大数据之前已经形成的思维倾向,基于碎片化信息重组的大数据分析会被进一步强化和合理化。[77]

(二)数据赋能与控辩平等原则的冲突

从前文分析可以看出,个人信息大数据发挥功效需要具备两个前提:一是规模数据的收集获取能力;二是具备与该规模相适应的数据分析能力。目前,数据收集工作以及原始数据库的形成将主要由政府、网络信息业者以及大型研究机构等承担,数据共享则主要发生在商业机构与政府部门以及政府部门之间,由此引发个人信息大数据与刑事正当程序第二个层面的冲突,即与控辩平等原则的冲突。

1.基于数据获取能力差异形成的控辩不平等

刑事诉讼之举证责任在控方,但为保障有效行使辩护权,辩方也被赋予一定的取证手段。就电子类证据而言,2011年《律师办理电子数据证据业务操作指引》规定了律师搜集和提取电子数据证据的四种主要方式:指导当事人取证、自行取证、申请包括司法行政机关在内的有权机关取证、请求包括网络服务提供商在内的第三方取证等。在大数据介入刑事司法的语境下,后两种途径的重要性日益凸显,但我国目前尚未有文件明确规定个人或由其委托的律师如何以这两种途径从大数据的占有机构获取与个人案件相关之数据。同时,基于信息泄露、系统干扰、数据篡改等信息安全方面的考量,相关制度规则在不同程度上会对数据准入设置障碍,进而可能进一步扩大控辩双方在数据获取方面的能力差距。具体而言,这些障碍主要包括以下两种:一是基于国家安全考量设置的限制,二是基于个人信息保护考量设置的限制。

首先,就国家保密特权与数据库开放之间的关系而言,刑事辩护方在获取有利于被指控人的信息方面存在困难。以《保守国家秘密法》、《刑法》、《网络安全法》、《反恐怖主义法》等法律为框架,中国已经形成了一整套国家保密机制。这些规范性文件一般着重强调有关单位的保密义务,但对于相关权利人的知悉权则言之寥寥。例如《政府信息公开条例》第14条、第15条规定,行政机关不得公开涉及国家秘密、商业秘密、个人隐私的政府信息;例外情形包括权利人同意以及不公开可能对公共利益造成重大影响两种情形,但这些情形仅针对商业秘密与个人隐私信息,并不涉及国家秘密。与此同时,《保守国家秘密法》第9条明确将“维护国家安全活动和追查刑事犯罪中的秘密事项”列入国家秘密的范畴。

立法将维护国家安全与犯罪追查活动中的特定信息列为国家秘密,从而使权力机关原则上不得开放相关大数据的进入、提取、分析、使用,辩护方基于辩护权能否以及如何从有关部门获取相关数据,法律规定尚不明确。在大力推进政府部门间信息共享的大背景下,借由与其他政府部门的信息共享以及为网络运营者等的私主体的设定协助执法义务,侦查机关的信息获取能力大幅提升,这与辩护方所面临的取证限制形成鲜明对比。换言之,如果说在传统司法环境下所要实现的是辩护方与司法机关之间的平等对抗,进入大数据时代之后,这一对抗则上升为辩护方与政府部门整体的平等对抗。

其次,个人信息保护同样能够成为辩方取证的障碍。以《网络安全法》为例,其第40条规定了网络运营者对用户信息严格保密的义务,同时第42条以信息被收集者的同意作为网络运营者向他人提供个人信息的前提条件。如前所述,这种保密义务并非绝对,例外情形主要限于该法第28条中规定的公安机关、国家安全机关依法维护国家安全和侦查犯罪的活动。与这一例外相对应,《刑事诉讼法》第54条第3款规定公检法在收集调取证据时,对涉及国家秘密、商业秘密、个人隐私的证据应当保密。

综合考察《民法典》第111条、《刑法》第253条之一以及“两高”《关于办理侵犯公民个人信息刑事案件适用法律若干问题的解释》之相关规定,信息“提供”或“获取”行为本身就已经足以构成对个人信息的干预。在大数据的语境下,个人信息的碎片化特征被不断强化,以是否侵犯个人权利为标准划定取证行为边界的传统证据规则已经难以在事前有效制约公权力的行使。[78]换言之,在大数据的语境下,任何信息碎片都有可能经过重组转化为“涉及个人隐私”的信息。大数据的这一特性一方面导致信息被收集者的同意例外变得模糊不清和难以适用,另一方面亦使任何信息都有可能基于《刑事诉讼法》第54条之规定被列入保密范畴,从而构成包括辩护方在内的主体获取相关证据的制度障碍。

2.基于数据分析能力差异所形成的控辩不平等

除数据获取能力差异外,控辩不平等还有可能因数据分析能力不同而进一步恶化。数据获取能力与分析能力之间存在递进关系,在我国相关制度未对第一个层面加以明确的情况下,控辩双方在数据分析能力方面的差异尚未引起立法与司法实践的充分关注,但近期一些热点案件已经或多或少对这一问题有所触及。以 “快播案”为例。针对本案关键证据四台服务器,司法机关实施了一系列数据提取和分析活动,例如委托鉴定中心筛选服务器远程访问IP地址、检验视频格式文件修改痕迹、提取29841个视频文件并认定21251个淫秽视频等。一方面,以上提取和分析活动需要大量的专业技术人员参与以及相应的物力财力支持,以单个或少数几个律师进行辩护的传统策略已难以从证据内容本身进行有效应对;另一方面,相对于传统证据类型,电子数据证据的真实性或完整性很大程度上依赖于取证过程的规范性和科学性,而在当前机制下辩护方难以有效参与并监督司法行政机关的取证过程。

已有域外学者指出,利用数据庞大体量所进行的审前证据交换已经演变成了一种通过抬高诉讼成本而增强己方谈判筹码的诉讼策略。[79]在美国2009年著名的斯基林案[80]中,法院认为通过向被告方开放特定数据库,政府已经充分履行其证据开示义务,而不论数据库所包含数据量是否已经庞大到被告方不可能有效查找和提取文件。与之形成鲜明对比的是,早在1970年的迪奥卡迪案[81]中,法院则认为控方通过操作计算机向法院呈交证据,而辩方却无法获取可以用于交叉询问的计算程序,这种状况下的控辩对抗是不合理的。有学者将这种只提供数据库入口或最终分析结果而不考虑控辩双方实际的数据分析能力和实质的程序参与的做法称为“文件倾倒”(document dump),并认为其构成控辩双方的实质不平等。[82]

即便控辩双方掌握了同样的原始数据,由于大数据所呈现出来的碎片化特征,双方有可能以同样的素材拼组出截然不同的事实。特别是当信息革命全面打碎个人信息之后,通过大数据的分析方法重组这些信息碎片,拼组出的将是“数字人”(digital person)[83]而非必然是现实生活中的真实个体。也正是基于这一忧虑,公平信息实践(Fair Information Practices,FIP)普遍将信息质量和准确性作为基本原则之一。[84]可以预见的是,随着以信息碎片作为核心要素的大数据不断深入介入刑事司法,数据本身的质量以及算法的可靠性将成为大数据应用的关键。如何赋予辩方挑战控方分析方法与结论的能力,以及如何在控辩双方形成的解读之间以相对中立的方式进行评价,是大数据带给犯罪治理的新挑战。

鉴于此,无论是在数据搜集获取层面,还是在数据分析层面,大数据将使控辩双方的能力差异日益扩大。沿着社会“数据化”(datafication)[85]搭建起来的逻辑链条进一步分析,我们可以形成以下推断:基于形式平等的审前取证与庭审质证所建立起来的刑事诉讼规则将难以维系;如果刑事司法未来计划强化而非放弃控辩平等原则,那么必须改革现有规则,以实现控辩双方面对包括大数据在内的电子数据证据时在数据搜集、获取、分析、呈现等方面能力上的平等。

(三)第三方介入与权力专属原则的冲突

基于前文“权利—权力”互动关系分析可以看出,在大数据背景下,谁掌握数据源,谁就有可能成为权力的实际执行者。人们在日常生活中遗留的大量数据痕迹并不必然自动、全面、及时地被录入政府数据库,而是会遗留在各类存储介质中,由网络信息业者等第三方收集并形成具有商业价值的数据分析基础。大数据的特性所引发的数据存储及披露义务的扩张,以及犯罪治理活动启动时点前移,意味着需要刑事司法权力机关以外的社会主体的介入,从而产生大数据侦查与刑事正当程序在第三个层面的冲突:第三方介入与权力专属原则的冲突。

《刑事诉讼法》第3条规定,除法律特别规定外,由公安机关、检察机关和法院行使特定刑事司法权力,其他任何机关、团体和个人都无权行使这些权力。立法者之所以将国家刑罚权之派生权力归属于特定主体,一者在于以职权特定化防止权力过度扩张,二者在于以分工明确化落实分权制衡,三者在于以程序法定化避免法外行权。在大数据语境下,传统的刑事司法权力特别是侦查权被稀释,侦、控、审之间的界限由于公众的普遍参与而有模糊化的倾向,而由民众自主发起的包括监控、追查、公布、谴责等犯罪治理活动在现有法律框架下难以得到有效规制。

这一冲突的直接体现是众包侦查(crowdsourcing)的兴起。该模式同样以大规模数据积累为基础,但在运行逻辑上强调的是基于不确定数据来源的数据搜集分析。[86]在众包侦查模式下,监督和评估潜在犯罪行为并为实际发生的案件提供线索和证据的工作,开始由传统意义上的执法机关向不特定社会群体转移。这种任务转移不仅针对已经发生的特定案件,还被广泛用于犯罪预测等活动。即便针对已经发生的案件,众包侦查模式下相关参与群体的活动也区别于传统意义上被动提供证据或线索的证人;这些群体会主动向特定算法提供数据,后者会自动生成分析结果。

典型的借助众包侦查模式进行犯罪风险治理的实践是2006年美国得克萨斯州采用的“虚拟边境观测系统”(Texas Virtual Border Watch),该系统允许个人通过网络摄像头观测并实时汇报违规穿越美国与墨西哥边境的行为。[87]众包侦查得以在国际层面引起广泛关注的关键性事件是2013年美国波士顿马拉松爆炸案,本案中FBI在短时间内接收到由网友主动提供的数以千计的相关照片和信息,使其得以快速锁定犯罪嫌疑人和可能的炸弹安置点。[88]就我国而言,众包式执法的早期模式见诸“人肉搜索”这种相对带有私刑性质的群体性网络暴力行为,[89]现在则转化为相对规范和有明显公私合作性质的模式,同时如前章所述,网络信息业者也逐渐演化为司法运行的常规合作方。