大数据侦查是大数据时代侦查创新的必然产物,是新兴科技与侦查权力强势结合的表现形态,是应对犯罪形态升级、防控严重犯罪的有力武器,但同时我们也应该警惕其成为致使公民合法权益受到侵害的危险之源。所以,作为研究前提,有必要对大数据侦查的概念、特点以及技术方法等内容进行考察分析,从而框定研究范围、明确研究对象。
(一)大数据侦查的概念界定
关于“大数据侦查”的概念,目前尚未形成一种具有权威性的通说。概念作为法律构造的工具,亦是法律体系形成的基础,其抽象性往往让它能够涵摄整个行为的指向对象,具有高度的凝练性。因此,对“大数据侦查”指向对象的观察视角不同,也就出现了对这一概念的多种解读。有学者认为,“大数据侦查”是一个活动过程,“是信息化时代大数据技术与侦查工作的有机结合,是侦查机关依照法律规定,为了揭露证实犯罪、打击防控犯罪,对与侦查活动有关的开源网络数据与内部系统数据进行有针对性的、系统性的抽取和集成,并进行深度的分析研判和结果运用的活动过程”
。也有学者认为“大数据侦查”是一种模式,“是指侦查机关借助大数据和云计算技术,利用特定算法(包含藉由经验而得的直觉判断)对普遍存在且全面自动化收集的社会信息进行分析,形成对已发犯罪的侦查线索和未来犯罪发展趋势进行判断的一种犯罪侦查和控制模式”
。还有学者认为,“大数据侦查”是一种理念和方法论,“是指围绕侦查工作目标,以现代技术搭建平台为支撑,通过对海量数据的深度挖掘、智能处理和专业分析开展侦查工作的理念与方法之统称”
。笔者根据调研访谈结果分析来看,侦查实务界对“大数据侦查”这一概念同样尚未形成统一认识,其与“大数据研判”“警用大数据”“公安大数据”“数据侦查”“数字侦查”“智慧侦查”等概念往往交混使用。
但实际上,上述内容在本质上均属于学界关于“大数据侦查”的研究内容。
可见,“大数据侦查”是一个动态发展中的概念,更是一个具有多维层次的立体化概念,正在渐趋成熟、日益完善。笔者认为应当基于广义视角对其定义,“大数据侦查”是一个涵盖了侦查技术、侦查措施、侦查行为、侦查方法、侦查模式、侦查机制等在内的完整概念体系。
总体而言,“大数据侦查”既是指法定侦查机关针对已经发生的犯罪行为或者尚未发生但却存在高度犯罪风险的行为,通过综合运用大数据技术,以实现查明案件事实真相、缉捕犯罪嫌疑人、预测和防控犯罪行为之目标的相关侦查行为;同时其又不仅仅局限于技术行为层面,还包括大数据思维
在侦查模式转型
、侦查方法创新
、侦查机制完善
等各方面的综合运用,是一个具有多维层次的系统概念。
(二)大数据侦查概念的相关质疑与评析
对于“大数据侦查”这一概念,学界一直存在不同的见解,甚至有所争议,其中自然包括了怀疑否定的声音,对此我们应当基于客观理性的立场进行审视。持质疑态度的学者认为,“大数据侦查”以及与其相关的“数据化侦查”“数字化侦查”等概念,存在概念炒作及大数据崇拜的现象。持此观点的学者指出,“大数据”只是侦查的一个要素,并没有推动侦查模式的转型,也没有导致传统侦查发生根本性的变革。因此“大数据侦查”的概念夸大了大数据对侦查的影响,其自身又缺乏充足的理论依据,这反而会不利于大数据在侦查领域的应用。
具体而言,对“大数据侦查”这一概念的质疑主要集中于以下几个方面问题的思考:其一,“大数据”是否仅为侦查的一个要素,它又是否能够贯穿于整个侦查活动,并独立支撑起侦查工作的开展?其二,“大数据”是否仅为众多侦查措施中的一种辅助性手段,如果是这样,那么又是否存在创建“大数据侦查”这一概念的必要性?其三,“大数据侦查”与“传统侦查”是否存在本质上的差别,它能否被独立视作一种新的侦查类型?其四,在大数据时代的伊始阶段,不少学者所倡导的应然层面的“大数据侦查”是否过于理想化,在侦查实践、司法实践中能否转化成现实?持质疑批判观点的学者认为,如果对于以上几个核心问题无法作出准确回应,那么提出“大数据侦查”这一概念便缺少理论自洽性。
上述问题的提出对于“大数据侦查”的证成提供了有益的思考路径,有利于对大数据侦查做更为深入的研究。当然对于质疑者的疑问,也可以从以下几方面进行回应。
首先,“大数据侦查”中的“大数据”并非只是侦查的一个要素,也不仅局限于一种辅助性手段的定位,它还涵盖了大数据侦查思维、大数据侦查模式、大数据侦查方法、大数据侦查行为、大数据侦查程序、大数据侦查制度、大数据侦查法律法规等一系列基本问题,它能够独立地贯穿于整个侦查工作的开展。
不仅如此,越来越多的学者开始意识到,大数据不仅可以独立地贯穿于侦查活动,还会影响到立案、起诉、审判甚至执行等诉讼环节。
其次,大数据侦查与传统侦查有着显著差别,是大数据时代侦查创新的重要体现。这种侦查之“新”体现在多个方面:其一,这是一项全新高新技术在刑事侦查中的应用,其法律属性既不是“搜查”,也不是“调取”,亦不能被直接视为“技术侦查”,现行刑事诉讼法及法律解释中关于侦查行为的分类无法容纳“大数据侦查”这一新兴侦查措施
;其二,大数据侦查改变了案件的形成模式、信息获取方式和结果的可预测性,实现了传统“回溯型”侦查模式向“预防型”侦查模式的变革,是对风险社会下有效防控社会风险的积极回应
;其三,大数据侦查还带来了侦查思维的转型,相较于传统侦查思维,开始从因果性思维转向相关性思维、从抽样性思维转向整体性思维、从回溯性思维转向预测性思维、从分散孤立思维转向共享协作思维,从而构建起了大数据侦查的逻辑体系。
上述这些技术层面、法律层面以及逻辑思维层面的变化,体现出大数据侦查与传统侦查有着本质不同,它已远非众多侦查措施中的一种辅助性手段,而是一种独立的新型侦查措施。
最后,关于“大数据侦查”学理研究与侦查实践脱节的问题。在笔者看来,问题的关键不在于应然层面的“大数据侦查”是否可以付诸实践,恰恰相反,而是当前对于“大数据侦查”的理论研究严重滞后于大数据在侦查中的应用实践。尽管目前对于“大数据侦查”,国内外学者普遍缺乏深入、系统的研究,但这并没有阻碍它的广泛应用,我国侦查实务部门对大数据技术的侦查应用还在进一步拓展和深化。
笔者通过与大数据侦查一线工作人员进行的访谈也证实了这一点,大数据侦查的实践应用遥遥领先于关于它的理论研究,很多我们意想不到的技术手段和侦查思路开始广泛使用,这已不是一个理论构想过于理想化的问题,而是学理研究严重滞后于侦查实践以至于不能及时引领正确法治方向的问题。
综上,笔者认为,“大数据侦查”概念的提出既具有扎实的理论根据,又在侦查实践中呈现出愈加显著的现实意义。从理论层面来看,将这种新的侦查行为、侦查活动、侦查模式、侦查机制、侦查现象概念化,可以起到聚焦的作用,促进该领域关注者之间信息与观点的传递抑或碰撞,从而产生新的智识,推动研究深化与学术进步。从实践指导意义而言,有利于形成对以上侦查行为模式的框架式约束,恰如没有方向的风最难识别、没有牌照的车最难管理、没有目标的行动最难预测一样,如果不对这种已经应用于实践并预期将在未来广泛适用的侦查活动概念化、类型化,那么也便很难实现其规范化和法治化。
当然,跳出“概念之争”的藩篱,我们更应该关注的是大数据运用于侦查实践所引发的实质问题。通过梳理可以发现,围绕“大数据侦查”引发的问题争议,研究者大致可以分为两大阵营:质疑者阵营与支持者阵营。质疑者阵营中又可以区分为“技术性质疑派”与“合法性质疑派”;而支持者阵营中则又可以区分为“激进支持派”与“保守支持派”。其中,“保守支持派”的学者看到了大数据给侦查带来的技术变革与理念更新,认为传统的侦查模式在新形势下向主动型、精密型、技术型、前瞻型转变是大势所趋,但同时也要保持客观理性,基于审慎的态度认识大数据在侦查中的作用,以侦查法治为“内脑”、科学技术为“外脑”,处理好二者之间的关系。
笔者倾向于“保守支持派”的观点,因为其更符合程序法治视野下刑事侦查与大数据技术的互动关系与基本定位。侦查模式的转型,不是对传统的颠覆,而是在吸收传统侦查模式合理内核基础上的创新与发展。
这种转型既是打击犯罪的必然要求,亦是一种法治现代化的具体表现。例如,“跟踪”“守候”作为侦查学领域内的一种传统侦查措施,借助大数据技术完全可以实现GPS定位、视频跟踪、视频守候等,这种数据技术元素的加入使得传统侦查措施更具活力,是一种继承基础上的创新发展。此外,“控制赃物”“阵地控制”也都将烙印上数字化控制、智能化控制的时代内容。
我们应当准确把握并顺应时代发展的需要,实现由传统侦查向大数据侦查的革新。
实际上,不管持何种观点,支持也好,质疑也罢,其中有一点已经形成共识:大数据确实已经运用于侦查实践,并将更广泛地运用于刑事犯罪的打击与预防之中,这是不可逆的时代潮流,也是侦查实践开展、侦查理论创新乃至整个刑事法学研究都无法回避的课题。
区别于传统侦查活动,大数据侦查具有显著的时代特征,彰显出鲜明的科技属性。大数据侦查更加关注对于海量数据的分析研判,并日益趋向人工智能化,让侦查活动更具全局性、实时性和相关性,从而打破时间与空间的局限,以实现犯罪侦查与犯罪防控的一体化。
(一)数据驱动
大数据侦查的核心特点是对于客观数据的高度关注。数据作为一种核心驱动力引导侦查工作的开展,逐步形成了“以数据空间为场景、以数据集合为载体、以数据算法为工具、以数据价值为目的”
的全新侦查模式。此种模式下,侦查机关可以充分借助海量的数据进行线索收集和电子取证,从而丰富情报资源、提升侦查主动性,更有利于对客观事实的及时发现和法律事实的公平裁判。
大数据时代的侦查模式,正在形成一条由“现场驱动”向“数据驱动”的演进路径。
传统侦查理论通常认为,侦查工作往往是以犯罪现场为起点,是一种“现场驱动”型的侦查模式。然而,随着大数据逐步运用于侦查实践,“数据驱动”的特征日趋明显,极大地提升了侦查效能。借助大数据技术,侦查人员可以通过情报检索、贝叶斯定律、程序碰撞、在线分析处理等多种方法将有价值的侦查信息从纷繁复杂的数据集合中挖掘出来,实现对于侦查资源的最大化利用。侦查工作的开展不再仅仅局限于犯罪现场的“物理空间”,而更加关注到“二元空间”
“双层社会”
背景下的“数据空间”。借助传统物质交换原理和信息论原理进行阐释,犯罪行为的出现会引发周围物质与信息的变动,犯罪的过程实际上也是物质交换与信息传递的过程,其中必然会留下痕迹线索。
如今人们已经很难完全脱离电子产品设备和互联网络空间,也就意味着犯罪行为将被更多以数字化的形式记录下来,并且这种记录不同于传统物理空间内的痕迹,而是一种更具保存持久性的电子痕迹。
大数据侦查的“数据驱动”特征从本质上体现出的是侦查思维的转型、侦查视野的拓展。笔者在调研中了解到,S省J市公安机关通过网监、刑侦与情报部门的对接,借助大数据对于网络电信流量进行分析,尤其是对于一些特定时间段内的网络流量异常值进行深入研判,获取了有价值的情报线索,在进一步对异常电信流量输出值所在IP进行定位的基础上,抓捕犯罪嫌疑人、固定证据,从而侦破了一起团伙偷录偷拍隐私视频进行网络贩售的涉黄案件。
该案的发现和侦破过程,并不是基于传统的“由人到案”或者“由案到人”模式,而是完全基于数据分析进行研判获取线索。因此,如果说传统侦查模式是一种“以物理犯罪现场为中心点,向外发散式侦查”的平面图形,那么这种以“数据驱动”为特征的大数据侦查模式则是一种“以物理犯罪空间与虚拟数据空间为中轴,通过收集、分析环绕数据线索以发现事实真相”的立体空间。从侦查学角度来看,“有犯罪必有证据”,这句话即使放置于大数据时代背景下的虚拟空间同样适用,数字留痕,无处不在的数据就是连接案件事实与法律事实的重要桥梁。在理想状态下,“数据驱动”的侦查工作将更具客观性、全面性。
(二)人工智能
人工智能是大数据侦查的另一重要特征。从科学技术发展的角度来看,人工智能无疑代表着最新发展方向,通过模拟人脑思维使机器或软件具有推理、记忆、理解、分析、学习以及计划等类人化智能,从而将人类从简单、重复的机械劳动中解放出来。从字面意思来看,“人工智能”包括“人工”与“智能”两个方面。具体到大数据侦查的语境下,这里的“人工”是指侦查意识、侦查方向、侦查目标的明确;“智能”则是指在大数据分析运用过程中,算法与技术的智能化。“人工”与“智能”是辩证统一的关系,二者缺一不可,共同确保了大数据侦查法治路径与技术路径的并行不悖。
“智能”是技术层面追求“效率”的客观需求和特征体现。大数据之“大”之“新”在前文中已经论及,当其运用于侦查实践,如果还是依靠传统人工对数据进行一一比对分析,那么浩繁的数据量将成为有限侦查资源的不能承受之重,大数据侦查工作也便无从谈起。以前几年北京市交通智能化分析平台建设为例,它汇聚了北京市有关交通运输方面的各种信息数据,仅公共交通每天刷卡产生的记录信息就高达1900万条,出租车在运营过程中所产生的数据也突破了100万条,日渐普及的ETC数据也达到了每天50万条等。
当面临如此浩繁复杂的数据集合时,如何从中尽快提取出有价值的信息,算法的优化、技术的智能化成为重要前提。因此,如果说数据是人工智能的基础,那么算法就是人工智能的本质。
在具体侦查实践中,这种智能性主要表现于数据收集、数据分析、数据呈现等多个环节。例如在收集数据时,经常会运用到传感技术、日志文件、网络爬虫等
;在数据分析时,经常会运用到数据挖掘、人脸识别等技术,张学友四场演唱会 AI 人脸识别抓捕五名逃犯就是很好的例证。
由此可见,升级算法、优化技术对于大数据的信息追踪将起到至关重要的作用,有利于节省侦查资源,提升侦查效率。当然,仅“智能”不“人工”同样不行,否则就背离了侦查的本质,应当警惕“科技决定论”的漩涡。约翰·马尔科夫曾经在《人工智能简史》中写道:“机器或许最终能够模仿人类的动作与感受,但是它们毕竟不是人类。”
我国学者也曾公开表示,我们的司法不应当被现代科技带着走,而是要顺应科技的发展趋势,运用科学技术的手段,为司法所用。
大数据侦查过程中,“人工”与“智能”的关系同样如此,智能化是以侦查目的正当、侦查方向明确、侦查程序法治为前提的。
综上,大数据侦查的“人工智能”特征从本质上反映了其前沿科技属性。具体到侦查实践中,体现出的是传统“人力密集型侦查”向“技术密集型侦查”的转变,但需要注意的是这种转变绝非完全的替代,而是一种继承与发展。以此为基础,“人工智能”引领下的侦查工作科技色彩更加突出,自动智能化的数据分析将占据重要作用。
(三)全时相关
“全时相关”是大数据侦查区别于传统侦查的突出特征。“我们正处于一种不断变化但日趋精密的被监视状态中。事实上,现在我们的一举一动都能在某个数据库中找到线索。”
这样一种判断并非天马行空、危言耸听,“万物互联、人人在线、事事算法”的大数据时代已然到来,社会的主体结构将从“分层”转向“结网”。
对于个案开展侦查,传统上都是基于层级式与流程式,追求逻辑上的因果关系,大数据侦查则更注重相关关系,通过结网而形成系统,以此来追踪和揭示事实真相。
这种“全时相关”的侦查模式打破了时间与空间的局限,更有利于实现犯罪侦查与犯罪防控的一体化。
从字面意义来看,“全时相关”具有三重含义:全局性、实时性、相关性。首先,大数据侦查具有全局性的特点,在时间轴线上,它对犯罪行为的观察视角不再仅仅停留于事后的“回溯观察”,而是更加关注到了犯罪预防的重要性,将侦查防控的时间起点提前,起到“防患于未然”的作用;在空间轴线上,大数据侦查更加关注犯罪行为发生的外部空间环境,尤其是虚拟空间内的数据信息,而不仅仅局限于犯罪现场、犯罪嫌疑人,这将起到完备证据链条的作用。其次,大数据具有实时性的特点,这就将“犯罪”与“侦查”尽可能地拉回到了同一起跑线上。在以往情形下往往是“犯罪在前面跑,侦查在后面追”,导致传统侦查总是处于被动出击的位置,大数据技术内在的涵盖了电信监控、网络监控、视频监控等实时侦查举措,大大提升了案件侦查的时效性,可以更加及时地制止犯罪,尽可能减少危害后果的发生。最后,大数据侦查具有相关性的特点。传统侦查模式是一个“由果溯因”的逻辑推演过程,是一种基于因果关系对犯罪行为结果“寻因”查明真相的过程。而大数据的相关性思维在侦查过程中同样产生了显著影响。大数据侦查并非把因果关系作为起始点,而是旨在获得尽可能全样本的与案件事实息息相关的数据信息,从而还原案件究竟“是什么”,而非“为什么”。对大数据来讲,用数理关系揭示“是什么”比用因果关系揭示“为什么”更为可靠,这是大数据侦查相关性思维的合理性与可行性的本源因素。
在侦查实践中,特别是当情报线索中断无法利用因果关系突破侦查僵局时,大数据侦查的相关性特点优势明显。通过外围碎片式信息、隐藏性线索的收集、汇总、分析来发现新的案情突破点,让客观案件事实尽可能全面地呈现出来。
大数据侦查的“全时相关”特征从本质上反映出的是一种思维模式的升级,更加关注犯罪现场的空间立体化、侦查防控时间的实时性以及数据还原案件事实的相关关联性。具体到侦查实践中,表现在对于犯罪防控的重视度空前提升,“被动型侦查”开始向“主动型侦查”转型。“全时相关”特征下的侦查工作更具主动性、整体性和客观性。
总而言之,以“数据驱动”“人工智能”“全时相关”为主要特点的大数据侦查,实现了传统侦查技术、侦查方法、侦查模式乃至侦查思维的创新升级,使情报来源更加多元化、线索证据更加丰富化、侦查启动更加主动化、犯罪预警更加提前化、案情分析更加智能化、侦查破案更加高效化。
如前所述,大数据是一个开放式的系统化概念,当其运用于侦查领域,就具有了大数据侦查技术、大数据侦查思维、大数据侦查模式以及大数据侦查机制等多重含义。笔者通过对全国不同地区的侦查人员抽样访谈获悉,目前我国公安部正在大力推进“公安大数据战略”,在战略引领下各省公安厅、市公安局高度重视大数据技术在侦查领域内的综合应用,技术革新已成为近几年来的主抓工程。
我们有必要深入侦查实践,对大数据侦查的具体技术方法进行考察。
从技术层面看,大数据侦查实际上是一种对隐蔽痕迹、规律的侦查,区别于信息化侦查,它需要通过对于碎片式信息的深加工,从中发现对侦查有价值的线索抑或证据。也正因此,有学者认为在大数据时代应当更加依靠“电子轨迹”
来开展“轨迹侦查”
。在实践中,越来越多的侦查机关在侦查中采用数据搜索、数据碰撞、数据挖掘、数据画像等技术,帮助他们发现线索,更好地实现犯罪网络及犯罪热点的分析研判,做到提前预警和布控,争取侦查主动权。
例如:在公安部统一部署开展的“清源行动”中,由于大部分犯罪行为人多采取网络化、电子化的运作方式,包括信息流、资金流等在内的一系列犯罪信息通过网络实现流转,这就需要借助大数据技术对网络信息数据进行挖掘分析,根据犯罪高危地区的人员流动规律、资金流转信息甚至数据流量变化信息等的大数据计算,准确地获取涉嫌犯罪的嫌疑账号、嫌疑通讯号码以及嫌疑人员名单,从而打击掉一片电信网络诈骗团伙。再如:浙江省公安厅曾利用大数据计算出“伪基站”类犯罪行为人人员特征、行为特征、车辆特征、轨迹特征等,提前预测该类犯罪嫌疑人进入浙江省的作案活动范围、行进路线等,从而实时监测、持续跟踪、提前布控,提前预警各市公安局按照省厅统一指挥实施抓捕,从而让此类“伪基站”类案件数量呈现断崖式下降。由此可见,大数据侦查已经得到广泛的运用。在实践中,大数据侦查的技术方法大致可以概括为如下几种:数据搜索法、数据碰撞法、数据挖掘法、数据画像法等。
第一,数据搜索法是指依托于数据库、互联网、相关电子仪器设备及网络环境所存储的信息数据进行直接搜索,以获取有价值的侦查资源的一种方法。根据数据来源的不同,又可以分为数据库搜索、互联网搜索以及电子数据搜索。数据库搜索的关键在于数据库的丰富性,侦查实践中常用的数据库主要有侦查机关自建数据库、政府机构数据库、社会行业数据库以及专业的“数据超市”。近些年来,山东省、浙江省、贵州省、广东省、新疆维吾尔自治区等地区的公安机关纷纷尝试“警务云”建设,整合各类数据库以服务侦查工作的开展。在数据库搜索中,一个重要的技巧在于对“唯一识别性”条件的确定,以此来缩小数据查找的范围。互联网搜索相对于封闭的数据库搜索而言,其更具开放性和动态性,互联网数据数量巨大且非结构化数据居多,所以要在鱼龙混杂的网络信息数据中搜索有价值的案件线索,应当优化搜索技巧,通过选择权威的搜索引擎、尽可能设置多条件并列的高级搜索模式、注重关键词的合理设定等方式提高搜索效率。电子数据搜索则往往与电子取证紧密相关,除了需要对相关电子仪器设备(如网络服务器、电脑硬盘、智能手机、智能手环等)进行查封、扣押,再借助专业的电子取证设备进行相关数据信息的提取和搜索之外,目前还可以借助大数据技术实现网络现场勘查,对网络各分层数据进行提取分析;另外,还可以通过网络监控实时获取电子数据,进一步提升数据收集、提取与分析的效率。
第二,数据碰撞法也称“撞库法”,是指侦查机关通过专门的计算机软件对两个或两个以上的数据库进行碰撞比对,并对由此产生的重合数据、差异数据进行深度分析的一种方法。数据碰撞法的运行流程大致为“明确目标对象—选定数据集合—进行碰撞比对—得出分析结论”。根据碰撞集合的不同,数据库碰撞法大致又可以分为手机数据碰撞、银行数据碰撞、网络轨迹碰撞、车辆轨迹碰撞、视频轨迹碰撞等。以手机数据碰撞为例,结合具体侦查目标,既要关注碰撞结果的“重复值”,又要关注碰撞结果的“差异值”。比如,在某起杀人抛尸案件中,侦查人员可以借助手机基站数据情况,将杀人现场的手机基站数据与抛尸现场的手机基站数据进行碰撞,通过分析“重复值”来掌握了解在特定时间段都曾出现在两个现场的人员情况,从而缩小犯罪嫌疑人的目标范围。再比如,在一起贪腐案件中,侦查人员往往可以搜查扣押犯罪嫌疑人的通讯工具,然后可以调取查看相关手机话单数据情况,将手机自身存储的通话记录数据与电信部门所提供的通话记录数据进行碰撞,通过两份通讯数据的“差异值”分析,往往可以发现与犯罪嫌疑人存在非同一般关系的涉案敏感人员,从而找准案件新的突破口,打破此类犯罪案件的侦查僵局。
第三,数据挖掘法是大数据侦查的高级应用手段,需要综合运用统计学、运行算法以及人工智能等多种计算机技术来发现表象之下隐藏的信息和规律。这就需要对海量的数据进行高运转速率的收集、汇总、分析,通过关联性分析、分类分析、聚类分析、时序分析、异常分析等达到侦查的预期效果。目前侦查实践中,对手机数据进行挖掘是最常见也最具代表性的一类数据挖掘。区别于前文所述的一般手机数据搜索、手机数据碰撞,手机数据挖掘更关注对“元数据”的分析。通过对此类信息数据的挖掘分析,更容易找到案件的突破口,获取侦查目标人员的行为规律、兴趣爱好乃至性格特点等。例如,在一起毒品犯罪案件中,犯罪嫌疑人对其交易的地点及时间拒不交代,以往侦查只能通过其他犯罪嫌疑人的供述来确定其行为轨迹,还原案件发生经过。但是借助大数据挖掘技术,侦查机关对犯罪嫌疑人手机中恢复的给买家放置毒品的图片及视频开动脑筋,通过信息提取软件(exif查看器)查看照片和视频的拍摄时间和坐标,再运用软件(photomap)按照时间顺序自动绘制出其贩卖毒品的行动轨迹。在客观证据面前,犯罪嫌疑人交代了自己的犯罪经过。本案中,侦查人员就是巧妙地挖掘出了图片、视频中所隐含的 GPS 位置信息等空天大数据资源,为案件的突破提供了有力支撑。
另外,以强奸杀人案为例,通过对遗留在现场的犯罪嫌疑人手机进行数据挖掘,除了获取其基本的内容数据信息外,侦查人员还可以通过对“元数据”的挖掘分析,了解其每天不同手机软件的使用时间频率、无线网络的连接场所、地理方位的活动轨迹以及与受害人通讯联系的密切程度等,从而缩小犯罪嫌疑人目标范围。
第四,数据画像法是传统犯罪心理画像在大数据时代的升级。犯罪心理画像原本是指侦查人员根据犯罪现场遗留的痕迹、物证等信息,结合主观经验判断,来对犯罪嫌疑人的外形、身份、心理活动等进行描绘的过程。
进入大数据时代,据以描绘犯罪嫌疑人的信息更加丰富,可以通过对涉案人员日常生活中留存的海量信息数据进行分析,更为全面、具体地了解其行为习惯、兴趣爱好、生活习惯乃至社交范围等情况,从而形成数据画像。数据画像是信息化、智能化时代大数据技术与侦查画像技术的有机结合,基于侦查对象的基本属性、行为特性、心理特征、社会标识等,收集相关的内外部系统数据和开源关联网络数据进行有针对性、系统性地分类与聚类、抽取与集成,最终形成侦查特定对象的标签卡,让侦查工作愈加技术化、便捷化、智能化。
另外,通过综合利用社会化数据建立分析模型,以全方位获取情报信息开展侦查,抑或通过“微表情分析”在侦查讯问中突破犯罪嫌疑人心理防线的过程,也有学者将其称之为“数据人”项目。
当前侦查实践中,数据画像法已经开始应用。以职务犯罪案件为例,据了解,福建省某市人民检察院依托“智慧检察大数据分析平台”,将犯罪嫌疑人的大量碎片数据收集汇总,通过大数据智能挖掘以及人工分析研判,形成该犯罪嫌疑人的身份标签、行为标签、人际关系标签以及兴趣标签等,便于侦查人员对犯罪嫌疑人有更为深入全面的了解,进而帮助提出侦查假说、制定侦查方案、确定讯问策略等。
可以说,只要具备充足的数据支撑,数据画像法可以使犯罪嫌疑人成为大数据笼罩之下的透明人。