购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

讲座内容

电子数据的“用”

刘 政

我从三个方面给大家做汇报,一个是“数据难用”,一个是“审查困境”,还有一个重点谈的是“检技配合”。

电子数据作为证据形式正式写入《刑事诉讼法》已有十多年的历史。电子数据从“取证”的角度来说已经形成相对成熟的生态,理论界和实务界都在研究电子取证。电子数据发展到今天,从取证的角度来说走到了相对成熟的阶段,同时也到了一定的瓶颈期——能取得出来就肯定能取出来,取不出来的还是取不出来。当然,现在电子数据的取证并非不发展了,比如从App分析、数据库取证、网站生态重构、恶意代码分析,到物联网取证、涉及智能设备的取证等。这就是在“取”的上面百家争鸣。回过头来,我们再看“用”,取了这个证据以后肯定是要用的,否则就不用取了。

我们先来说电子取证的生态,它的“衣食父母”究竟是谁?如果我们把电子数据比作“菜”,那么它的“衣食父母”就是最后吃“菜”的人,最后吃“菜”的人是谁?不是取证技术人员,也不是刑事技术人员、检察技术人员——他们更多的是在“取”上面做一些工作。真正用电子数据的人是谁?是法律从业人员,是侦查人员、检察官、法官、律师。

电子数据不同于传统的物证、书证,不论用什么手段获得的物证、书证,都很直观,拿过来就能看得明白、就能用。但是电子数据不一样。以检察院为例,往往到了审查起诉阶段,检察官手里的还是海量的电子数据,但检察官需要从中找到能够证明犯罪事实的证据。现在这个状况等于从海量的数据里淘金。那么,“用”现在是一个什么状态呢?有一个实务中的段子:侦查机关移送审查起诉的案件中的电子数据有500多个G,检察官跟侦查机关说你把电子数据给我打印出来拿过来!这个不是笑话。现在,无论是检察官、助理检察官还是书记员,更多的时候是怎么做的?是拿到手机报告取出来的文件,人工翻页、人工筛选、人工统计!“取”和“用”是不是形成了强烈的对比?特别是各个取证厂商在“取”这方面的产品,迭代非常快,而且非常炫。但是在如何“用”的方面,法律从业人员手里还没有审查电子数据的利器。所以就形成了电子数据的“取”和“用”是剃头挑子一头热的状态。这样发展下去,将来会是什么样?“取”可以,怎样先进地“取”都行。但是真正到“用”的时候,如果法律从业人员、办案人惧怕审查电子数据、惧怕运用电子数据,这样长期发展下去会是一个什么状态?大家可以想象一下。

一、数据难用

数据难用,主要体现在:第一,看不到。量大不易看,没有工具看,没有意识看(或者意识还没培养出来)。第二,搜不着。报告格式多样,提取的文件的类型繁多,量大且没有能够快速搜索的好用的工具。第三,用不好。海量电子数据往往存储于巨大的虚拟空间,其中往往蕴藏着远超司法机关掌握的违法犯罪线索,目前我们对其的挖掘、利用程度远远不够。这在实务中一次又一次得到了印证。现在实务就处于这样的状态——数据难用。

现在实务中电子数据“取”的情况是:侦查机关自行从磁盘、网络、手机收集提取或委托鉴定机构出具坚定意见,获得海量文件、数据库脚本网站源码和各种html报告。拿到数据,检察官的“审”只能用最传统的方式。我们都有类似的体会:随着信息技术运用越来越广泛,以往案件取得的数据用一张CD就能放下,后来是用DVD,再后来出现了蓝光光盘、移动硬盘(上TB级别)。前段时间,东城区人民检察院的一个案件,侦查机关送来的是阵列,包含60T的数据!

如今,提取的数据量越来越大,而且各种类型的数据都有。除了图片、文本、表格、视频等,还有脚本、源代码,如某个后缀为“.sql”的文件是数据库的脚本,其本身不具备可读性,要想读明白就需要技术人员运用技术工具进行转化。又如一份手机取证报告有35万余页,再如从某手机提取出的微信聊天记录有900余万条,这样的情况如何处理?

二、审查困境

检察机关在数据难用的背景下办案就直接面临审查困境。具体表现在以下几个方面。

第一,装备落后,难以满足正常工作需要。先不说检察技术人员,就连检察官手里都缺少审查电子证据必要的科技装备。侦查机关办案过程中收集的电子数据体量越来越大,但是很多地方的检察官办公电脑没有蓝光光驱,那如何读取蓝光光盘?更不用说其他的审查工具了。所以,装备落后是现在最大的困境。除此之外,检察技术的辅助装备也较为匮乏。

第二,海量电子数据审查与审限紧张的矛盾。数据体量越来越大,审查需要耗费大量时间,这也是目前电子数据审查实务中最为突出的问题。高效审查海量电子数据存在诸多困难,即使委托检察技术人员介入,利用专业手段和技术装备辅助开展电子数据审查,也需要一定的时间,而不论是审查逮捕还是审查起诉,均有时限要求。审查逮捕一般只有7天时间,在7天时限内审查、利用好电子数据,困难重重。在大量案件中,特别是经济案件中,逐渐呈现出信息网络化特征,导致犯罪证据多数以电子数据的形式留存,而此类电子数据的体量日益增大。如何实现关键证据的快速锁定、查询和审查是困扰一线办案人员的重要问题,尤其是在捕诉合一、案多人少的背景下,对于海量电子数据审查的提质增效就显得尤为重要。

第三,检察官审查电子数据缺乏指引。比如,是否可建立提醒机制,提醒检察官是否需要考虑委托技术性证据专门审查,是否需要辅助进行海量数据筛查等。再比如,什么性质的案件需要开展什么类型的电子数据鉴定,公安机关答复的无法鉴定或者无法收集提取的电子数据是否有依据等,这些问题的提出都需要有相当深厚的专业背景。

第四,检察官对电子数据的敏感度较低。检察官因其审查电子数据的技能跟不上,对电子数据的认识也就比较薄弱,但是现在,尤其是涉网犯罪中电子数据往往是核心证据,这种薄弱的意识就成为关键问题。

第五,检察机关专业技术人员配备不足、水平参差不齐。在多重改革的背景下,专业技术人员,特别是从事电子数据取证审查的人员,有一定流失。有的单位里的技术人员完全不再负责这一块儿的工作。然而,很多特殊电子数据还需要专业技术手段予以展现,但没有这样的专业技术人员提供辅助,就导致检察官面对电子数据这样的科学证据时没有安全感。

第六,公检法在刑事诉讼领域,对电子数据的认知存在差异。目前,公检法对电子数据的收集提取、移送展示、审查认定在理解程度上存在差异且不够统一,应当加强交流,统一标准。

三、检技配合

如何走出当下检技配合不足的困境?就目前来说,最直接也最容易实现的路径,还是从机制保障、人员配齐、观念转变、建立互信、工具完善等方面来突破,以此来更好地审查海量的电子数据。

机制保障方面,这几年检察机关针对检察技术辅助办案出台了不少规定。例如,2019年12月30日发布的《人民检察院刑事诉讼规则》第5条规定:“检察官办理案件,可以根据需要配备检察官助理、书记员、司法警察、检察技术人员等检察辅助人员。检察辅助人员依照法律规定承担相应的检察辅助事务。”又如,2018年4月3日发布的《最高人民检察院关于指派、聘请有专门知识的人参与办案若干问题的规定(试行)》,对检察技术人员参与办案给予了明确的定位和指导。2021年1月22日发布的《人民检察院办理网络犯罪案件规定》第8条规定:“建立检察技术人员、其他有专门知识的人参与网络犯罪案件办理制度。根据案件办理需要,吸收检察技术人员加入办案组辅助案件办理。积极探索运用大数据、云计算、人工智能等信息技术辅助办案,提高网络犯罪案件办理的专业化水平。”

就以东城区检察院为例,早在2017年检察体制改革之后,检察技术人员就面临检察技术工作的转型问题。东城区检察院当时已经作出了尝试,将本院的技术人员编入办案组。因为当时东城区检察院成立了“网络电信犯罪检察部”的专业化办案部门,我们有三名技术人员具备电子数据鉴定的资质,就将他们编入了办案组,配合进行案件办理,辅助开展电子数据的审查运用。

2021年发布的《人民检察院办理网络犯罪案件规定》中对于检察技术人员可以开展什么工作规定得比较明确。第12条规定,引导取证的过程中可以指派检察技术人员共同参与;第16条规定,检察机关制作继续侦查提纲或者补充侦查提纲的,对于专业性问题应当听取检察技术人员或者其他有专门知识人的意见;第23条规定,需对电子数据等技术性证据材料进行专门审查的,应当指派检察技术人员进行审查;第25条规定,自行侦查可以由人民检察院技术部门协助。另外,第46条和第47条规定,庭前会议和庭审时出示证据可以借助多媒体示证、动态演示等方式进行,特别是电子数据的庭审展示——有的时候一些数据、表格、文字比较平面生硬地展示在法庭上可能难以理解,但是如果把它们图形化、动态化可能就更便于法官理解。比如,对于违法所得资金流的展示,网络传销案件中人员层级的图形化展示等。

目前,此类机制保障在不断完善中,如北京市人民检察院根据最高人民检察院的一系列规定,于2018年制定了《北京市检察机关专业同步辅助审查工作指南》,并于2021年进行了修订,明确规定了检察技术人员参与办案时可以开展哪些工作,怎么开展以及怎么配合,尤其在电子数据这个门类中体现得更加充分。电子数据方面由具备电子数据取证审查专业技能的人员配合办案,现在北京做得是比较好的,这些专业技术人员可以开展技术咨询、勘验检查、搜查、鉴定、专门审查、技术协助等工作。

有了这样的机制保障之后,就需要转变观念。为什么我要提观念的转变?在监察体制改革前,电子数据取证的检察技术人员更多的工作就是配合自侦部门进行“取”。监察体制改革之后,检察技术人员何去何从?当时很多人有这样一种观念:监察体制改革了,自侦的案件量减少了,职务犯罪案件的量少了,技术人员取证的工作就弱化了。很多地方,包括一些个别的领导可能认为检察技术人员没有用了,这一块儿的工作已经不需要再开展,这些人员具备这样的技能也没有意义了。这种观念甚至到今天在极个别的地方还存在。这种观念要尽快转变。为什么?因为检察技术配合刑检开展电子数据审查工作,从工作形式到工作内容,面临的未知挑战比原来更多了,也就是说配合更为多元化了,而且它的价值一点都没有减少。刚才我提到,现在检察技术人员有一定的流失,现有的技术人员转岗后不再从事这样的工作,面临这样的现状就需要把能够从事电子数据辅助审查工作的技术人员配齐,这才是开展工作的基础。没有人,一切都是空谈。就目前来说,检察技术配合刑检,工作量占比最大的就是技术协助,而在电子数据这个门类中,技术协助最多的就是海量电子数据审查。

技术协助可以有很多种,除了占比最多的海量电子数据的分析,还有其他的一些技术协助的形式,但总体而言,海量电子数据的分析仍然是发现潜在证据并开展后续工作的利器。

实务中比较理想的配合的状态,就是我刚才提到的互信。我在检察官学院讲课的时候也会跟检察官交流,他们说听我讲完课以后才知道检察技术人员还能干这些工作!也有检察官提问:检察机关的这种鉴定机构怎么收费?从这些问题能够看得出来,检察官对检察技术辅助办案的职能是比较陌生的。既然检察官对这项工作这么陌生,那么怎么跟技术人员建立互信?他们认为技术人员就不具备这个能力,为什么还要让技术人员去做呢?所以建立互信,加强沟通,加强配合,从某一个点切入,在个案中配合好了,他们觉得技术人员能干,才会对技术人员有信任,在接下来的工作中才能形成双向的互动,而不是单向的奔赴。

理想的海量电子数据审查过程应该是这样的:检察官从案情以及证据审查角度出发,对海量电子数据的审查提出需求,并根据案情整理出一些关键词;技术人员从案情出发,结合刑检部门提出的需求,使用各种技术工具、装备、方法完成海量电子数据的审查、分析。技术辅助、支撑办案是幕后工作,为检察主职主业提供技术安全感。双方在长期的合作中才能建立互信。

接下来,我分享一些本院或者我参与的一些案件。比如,某非法吸收公众存款案移送审查起诉的电子数据体量是4.5TB,大部分都是图片、表格,文档。当时,一个U盘里有51份Excel表格,这是非常重要的。检察官的需求是,这51份表格肯定是从办公电脑里提取出来的,但是现在需要确定这些表格具体是从哪台电脑里提取出来的。这个问题就交给了技术人员,当时我们就将这51份Excel表格的哈希值制作了哈希列表,与鉴定机构提取的这4.5TB的电子数据进行哈希值比对,很快就完成了溯源,找到了同一文件的来源,就是确定某一个文件来源于哪里。如果让检察官自己和光盘中的数据逐一比对,大家可以想象,这根本是不现实的。还有一起非法吸收公众存款案,侦查机关调取了电子邮件650GB,300多万封邮件,如果不借助检察技术的一些手段和工具,大家可以想象,如何从这300多万封邮件中找出某一个人的收件、某一个人的发件?如何确定哪个部门的哪些邮件带了附件?哪些邮件是群发的,哪些邮件是单独发的?还有某侵犯公民个人信息案,当时侦查机关通过网络在线提取获得的就是数据库的脚本,是sql文件,其实就是一个数据库的备份。当然,用.txt的记事本方式是可以打开的,但是打开了怎么看呢?没有技术人员介入就没有办法直观地看到这个证据。后来,我们根据脚本分析,它是一个数据库平台。我们在本地搭建了数据库管理系统平台(DBMS),把脚本进行还原,发现这就是个数据库,比较简单,几张表,而且这些表的含义非常明确。我们把表导出为一个Excel表格交给检察官,就可以很直观地展示侵犯公民个人信息的证据。还有一个非法经营案,当时这个嫌疑人卖笑气,全部通过微信交流,聊天记录大概也是有数百万条,检察官审查起来非常困难,后来交给了我们。

在审查的过程中我们发现,但凡买主购买笑气,都会和嫌疑人有微信的沟通,也会在微信中进行转款,那么这个转款就会在聊天记录里生成具有一定文本特征的记录,我们就根据这个关键词对整个手机取证报告进行遍历,锁定所有的交易情况,再结合上下文,最后短时间内就将犯罪数额从不足5万提升至50万。那有人可能就问了,这个交易记录直接去腾讯调取不就得了吗?需要注意的是,我们调出来的是交易记录,但是看不出哪一笔是进行了笑气交易,所以说对于报告的这种搜索还是非常关键的。还有一个虚开发票案,要对手机报告进行筛查。当时这几个嫌疑人都是线上交流的,所以开具发票的信息也都在这个聊天记录里,审查起来非常费劲。我们也是通过技术手段,对聊天记录进行了整个的遍历,整理出来开发票的情况,就在这样审查的过程中,有了其他的重大发现,并进一步引导取证,从而将虚开的金额大幅提升。

目前有这样一种情况,虽然检察官与检察技术人员建立了互信,但是在审查中还是有非常尴尬的一个节点。我在前面说到了,现在各个厂商都还是把注意力放在“取”上,几乎还没有出现“非常成熟的”针对电子数据的审查的一些专属工具。我说的是“非常成熟的”没有,其他程度的工具还是有一些的。那么,现在在日常工作中,技术人员是怎么辅助检察官开展审查的呢?用一些取证的工具,加一部分可能还不够成熟的专属的审查工具,能够解决一些问题。比如,用一些关键词检索的工具,再加上一些类似于审查的工具,配合着使用可以对电子数据进行分析的工具。所以,我希望设备厂家能够在“用”的上面再投入一些精力,真正开发出更为完善的、专属的生产工具。根据我们的实务需求,专属的审查工具最起码应该具备浏览、搜索、标记、统计的功能。这种工具可以兼容,比如手机报告、聊天记录;同时可以导入各种各样的文件,比如公民个人信息、通讯和组织关系、资金和交易关系、网络流量和日志、文档型数据等;另外能够实现类似语音转文字的同时完成搜索的功能,或者不需要语音转文字就对语音进行搜索的功能,甚至可以对视频数据进行检索,或者首先对视频、图片进行识别,然后再实行检索。从智能搜索到各种统计,最后如果能加入语义分析,加入一些智能化的东西,那相对来说就比较完美了。除去最简单的,比如关键字搜索、报告的浏览、数据的浏览、数据的统计、标记打印这些功能之外,还有一些更为高端的需求,比如能够反映主体身份的内容(嫌疑人、受害者、其他相关人等),依据导进来的数据、手机报告,这个工具就能反映出主体身份,识别一些反映客观行为的内容;再比如针对犯罪之后的掩饰行为(实施行为、咨询行为等),有没有辅助识别“明知”这种反映主观故意的内容的工具;另外就是反映犯罪后果和犯罪情节的内容,比如犯罪数额(规模)的统计功能;等等。

这种审查工具不能仅针对技术人员的需求开发,而是应该同时推出重量级的、旗舰级的工具和轻量级的工具。什么意思呢?检察官是最主要的审查证据的人,拿到报告之后,如果他们手里能够有一些便捷的、快速的审查工具,起码就能够完成浏览、搜索、标记、导出、关键字搜索等工作。因为各个厂商出具的手机取证报告是多种多样的,如果有一个能够兼容这些报告的快速的检索工具,就能够实现最起码的关键字的检索。针对技术人员的旗舰版的工具可以实现全部的功能,甚至一些通联的分析、账单的分析、个人画像,等等。我还设想,工具与工具之间能不能实现互动,比如检察官提出更为复杂的专业化、专门性的需求,技术人员可以根据需求使用更为复杂的一些工具进行分析、搜索,得到一个结果反馈给检察官。

总的来说,我有这么几点感悟。第一,电子数据中蕴含着大量的有价值的信息,是一座宝库。它有大量的线索,大量能够证明犯罪事实的证据,绝对不要轻易放弃对电子数据的审查。第二,电子数据是有温度的,我们要让它“活”起来。大家都有这样的感受,现在手机也好,电脑也好,你离得开吗?你的生活、工作、学习的哪个环节离得开这些设备?电子数据就是人工作、学习、生活的电子化记录,是你的电子痕迹,所以电子数据是有温度的,要让它能够表现出这个电子数据的所有者的特征,相当于让它坐在你面前跟你对话。第三,技术人员在业务层面编入检察官办案组是一种比较不错的“检察+技术”模式。技术人员全流程进入办案,在辅助检察官进行科学证据、技术性证据审查运用的同时,也提升了自己的办案能力,促进了经验积累。第四,海量电子数据的审查模式,随着审查的工具越来越完善,功能越来越强大,就可以实现从人工到“人工+智能”的模式,而不是工具非常完善了,就完全靠着工具给你展现出来,那是不可能的。我举个简单的例子,要确定某一条收款记录是不是和毒品有关,得看上下文,不可能完全让机器和工具去判断。 bqvLJuuDbCjwtQb1MvWUJ5TAkgGGN8bg1mmvyg5NU6W4xxOFrEsbj3cA0lyycZLf

点击中间区域
呼出菜单
上一章
目录
下一章
×

打开