购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

第三章
犯罪空间分析方法

第一节
空间分析基本模式

空间信息分析包括数据获取和预处理(模块M1);当进行多源异构数据综合分析时,需要进行属性数据空间化和尺度转换处理(模块M2);然后进行空间数据探索分析(模块M3);之后根据属性数据的空间存在格式(空间连续分布或离散分布、规则或不规则多边形分布、多源复杂异构信息),分别引导建立地统计模型(模块M4)、格数据分析模型(模块M5)、复杂信息分解和预报模型(模块M6)以及其他M1至M3属数据预处理范畴,M4至M6属问题建模范畴,对建立的模型M4- M6需要求解,机理解释及预报 [9]

一、空间数据获取和预处理模式(M1)

空间数据采集与尽可能完备化是所有工作重要的第一步,主要利用采样、插值、缺值方法。

1.空间信息抽样估计,在地学空间应用领域,如环境监测、资源调查、社会统计等,空间信息抽样估计问题大量存在。空间抽样针对地学对象普遍存在的空间关联性和先验信息,从样本选取方式、空间关联性及精度衡量三方面对空间信息获取提供符合统计假设的新的解决思路。

2.空间数据插值与缺值,根据已知空间样本点(例如气象台站、野外调查)数据进行插值或推理来生成面状数据或估计未测点数值是地学研究经常遇到的问题。理解初始假设和使用的方法是空间插值过程的一个关键,为不同空间过程选择不同插值方法。

缺值问题与插值类似,有部分交叉,以Bayes先验概率为其特征。插值有点、面之分,对于面插值,经过预处理(如去除趋势特征等)可以进行缺值分析;对于点插值,经过预处理(如构建泰森多边形再去除趋势特征等)也可以使用缺值方法。对于缺值的补整,如果具备某些时空特征,则完全可以使用插值方法补整。

二、属性数据空间化与空间转换模式(M2)

自然与人文要素结合研究的时代正在到来。美国宇航局(NASA)将地表人类活动模式加入全球变化模型中从本质上提高了预报精度。又如,自然灾害的灾情空间预报需要自然要素和社会经济要素相互作用的计算,自然要素可以通过遥感获取,社会经济要素需要根据统计数据进行空间细化。地球生态环境以及社会经济数据通常是具有不同形状和尺度的地理空间单元,需要建立属性数据空间化及空间尺度转换技术,其核心是非空间信息或更大空间单元的属性数据在(较小)空间上表达的理论和方法,或称可变面元问题,包括三类技术:

GIS方法。实现地理空间单元间属性数据的转化,包括聚集、拆分和空间建模(Spatial modeling),聚集主要解决从小区域(点)向大区域(面)转化问题;拆分则考虑从大区域向小区域转化问题。前者可利用空间采样技术实现。

尺度转化理论及方法。不同的时间和空间尺度限制了信息被观测、描述、分析和表达的详细程度。尺度转化存在“自上而下”(Scaling down)和“自下而上”(Scaling up)两种基本方式,不同尺度水平上,尤其是Downscaling的转化,存在其区域边界规则与地理边界规则的差异、数据转化的控制和实施形式。

小区域统计学理论及方法。所谓“小区域”,本质上是指区域内样本点较少,因此在统计分析过程中,需要从相关区域“借力”来获得详细的信息,其核心是建立相关区域(数据)的联系模型,实现属性数据空间表达。

以上内容着眼点有所不同,但都可归结为属性数据从大区域向小区域转化,最终完成综合的属性数据空间化方法和软件包设计与实现,并对表达结果的精确性和不确定性做定量分析和解释。

三、空间信息探索分析模式(M3)

探索数据分析(Exploratory Data Analysis,EDA)目标是最大化分析者对数据集及其隐含结构的洞察,揭示数据属性,用以引导选择合适的数据分析模型。EDA主要采用图形技术进行以下分析:

1.最大化对数据集的洞察;2.揭示数据隐含的结构;3.提取重要的变量;4.检测异常点;5.检验隐含的假设条件;6.发展精简的模型;7.决定因素的最优设置。

空间数据探索分析(Exploratory Spatial Data Analysis,ESDA)是EDA的扩展,用来对具有空间定位信息的属性进行分析,包括:探索数据的空间模式,对假设数据模型、模型基础和数据的地理性质进行阐述,评价空间模型等。ESDA技术同样要求可视和健壮,强调把数字和图形技术与地图联系。对“某些事件在地图上的什么位置”,“这部分地图的属性值在概括统计中处于什么位置”,“地图的哪些区域满足特定的属性要求”等问题的回答是很重要的。本模块具体内容包括:

探索工具。软件实现当前已经有ESDA技术,并且实现表(Table)、地图(Map)和图形(Figure)各窗口链接,支持同时打开四个窗口:数据表窗口(显示当前数据和在过程中创建的变量),地图窗口,图形窗口和文本输出窗口(返回ESPA输出)。

区划(Regionalization)。空间单元有时很小,比如一个村或乡镇,如果以此进行自然犯罪发生率等小概率事件分析,统计对这种小的统计单元很敏感。由于空间信息分析要求各空间单元内的信息变差具有相对一致性,因此,经常需要对空间单元的大小进行调整,通过模型计算,实现统计单元的均质性(Homogeneity)平等性(Equality)和空间紧凑性(Compactness)。

四、地统计模式(M4)

点状数据或空间连续分布数据(直接获得或由点状数据通过空间插值或趋势面模拟获得)是空间数据的一种主要存在形式(例如气象台站、地质物探、生态环境等数据)。主要包括以下几方面:

1.变异函数(Variogram)。变异函数可以说是整个地统计学的基础,但以前人们只注重了点的变异函数。随着尺度问题的提出,变异函数的正则化(Regulization)问题提上了日程。

2.克里格方法(Kriging)。以往把Kriging法看成是地统计学的全部。通过它人们找到了一种最优的、无偏的估值方法。长期以来,人们仅仅把它看作是一种插值方法。其实不仅仅如此,Kriging还可以给出每一点的不确定性。利用多种附属信息填补采样不足的缺陷等。

3.模拟方法(Simulation)。这是当今地统计领域中最为活跃的一种方法。由于Kriging方法具有平滑作用,即将极大值偏小估计,极小值偏大估计,使得整幅图像趋于平缓。但有时人们需要的恰恰正是那种极值,例如在水污染中,就是要通过污染金属所表现的极值来发现污染源。此外,Simulation通过多种实现(Realization)系统的表现,研究问题的各种情况,具有较好的统计效用。

五、格数据分析模式(M5)

多边形数据(社会经济统计数据格式),包括规则格网数据(遥感),是空间数据的又一种主要存在形式。通过空间自相关和协相关模型,找出研究对象在空间布局上的联系与差异,以及空间多元解释变量。例如土地利用变化的环境和人文经济驱动因子识别,环境污染的空间动态建模,为预报和调控提供科学依据。空间局域统计分析技术,则可找出空间热点(Hotspots)问题区,应用于犯罪等空间格局的热点诊断和预报。

1.空间回归模型。空间回归分析技术可以用于探讨估计值的空间关系,地学对象的空间依赖性和空间异质性使一般回归方法不适应在空间上的分析。空间回归分析有三种特殊形式:(a)联立自回归模型;(b)空间移动平均模型;(c)条件自回归模型。

2.局域统计模型。局域统计分析模型对研究区域内距某一目标单元一定距离的空间范围内所有点的值进行分析。计算指定距离内的空间关联度,从而监测空间内的热点区域,并通过G检验。

六、多源复杂时空信息的分解、融合、预报模式(M6)

环境、地学、社会、经济、交通、疾病、遥感监测等时空信息大多是多源复杂因素综合作用的结果。通过观测信息反演地学过程机理是地球科学,特别是地球空间信息科学的基本任务之一,目前可用的数学方法有统计、神经网络、小波分析、遗传算法、元胞自动机等,也是目前数据挖掘的基本手段。但这些方法只能进行单一成因要素(团)提取和简单过程预报,要实现基于时空信息复合过程的科学预报,不仅需要实现多源复杂因子的分解,更需要将多种分解模式重新组构融合,形成一个新的整体模式。

另外,气象台站、生态网络、污染监测、野外采样、社会经济调查等等,均是空间分散的点状数据。根据已知点的值推断未知点的值,以及由这些点推断整个区域状况是地学研究的经常性任务。目前使用的是空间几何插值、简单加权平均的办法和新近的考虑全局和局域关联信息的空间统计方法。实际上,前人的研究已经获得了很多半结构化的地学机理和规律,这些先验信息与空间统计的结合有望从本质上提高空间估计预报的精度。借助贝叶斯方法建立统计和机理结合的空间扩展模型是一种可能的新途径。

总而言之,空间信息分析是指对地球空间信息进行分析模拟和预测,以及根据空间信息进行时空运筹的技术方法和理论。 O85suLXFzHfA27jSqd48PYihJjiVw3vtPRe+qjmWHXpzF0VA66RRnFNDW9iX1nYO

点击中间区域
呼出菜单
上一章
目录
下一章
×