购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

第一节
基于人口增长的犯罪预测

适度人口与犯罪的规模,不是柏拉图理想意义上的最优人口,是所谓的最低犯罪率。在对某地区人口与犯罪问题分析的基础上,对人口与犯罪的发展趋势给出合理的预测。

一、人口预测

人口流入推动了地区经济社会的迅速发展,同时也给地区的基础设施、资源环境和社会管理带来了压力。因此,研究地区的适度人口将对调控人口增长、改善区域生态与治安环境、发展地区经济,以及促进人口、资源、环境三者之间协调发展,具有非常重要的现实意义。地区适度人口与犯罪比例也成了人类社会可持续发展的一条基本实现途径。

社会经济发展水平是影响区域适度人口的关键,应该将就业看成制约人口容量乃至制约适度人口规模的一个重要因素。一个区域的居住人口实际上是由劳动力来供养的,劳动力需求量构成了区域人口承载力的最重要的基础。在一定的平均抚养系数下,一个区域可以提供的就业岗位的数量和质量就基本决定了该区域的经济适度人口规模:区域经济适度人口=就业需求量× 1 +平均抚养系数。对一个相对较长时期劳动力需求态势进行预测时,一个简单而且有效的方法是经济增长的就业弹性模型。就业人口需求量模型表述如下:

就业人口需求量预测值= N (现状就业人口)× 1 +就业人口增长率,其中,就业人口增长率=经济增长率×就业弹性系数, N 为预测的年份与现状年份的差。

由于无法精确地获得大连市的就业弹性系数,因此对经济增长的就业弹性系数采用高、中、低三种方案。其中:低方案采用经济增长就业弹性系数的全国平均值0. 17。中方案采用某地区2002年的就业弹性系数0. 20,该系数虽然比全国平均值高近20个百分点,但考虑到该地区的就业情况在全国是比较好的,而且随着就业渠道的多样化、经济结构优化以及我国综合实力增强,我们认为该地区在未来一段时间内保持该系数的可能性是很大的。高方案系数采用0. 25,该值比大连市平均值高出25个百分点。在预测中,2009年该地区从业人员为345万人,以此作为劳动力需求量预测的基数。经济增长率预测的依据主要是经济发展状况以及“发展规划纲要”所确定的经济发展指标。预计2011年之前该地区内生产总值年均增长率可保持在11%左右,2011—2020年保持在9%左右,预测结果见表4-1。

表4-1 地区劳动力需求量

由于缺乏该地区从业人口和被抚养人口的具体数据,我们根据以往数据进行预测。1998年,该地区从业人口占城市人口的47%,目前应在48%~49%。而最近几年随着外地年轻劳动力的流入,从业人口占总人口比重在2010年会达到52%,2020年则将降低至49%左右。根据前面预测的各年份所需要劳动力数量以及劳动人口与总人口的比率,可以确定该地区适度人口的变动范围,结果见表4-2。

表4-2 地区适度人口预测

图4-1给出了该地区2011—2020年人口增长数量预测:

图4-1 地区2011—2020年人口增长数量预测

根据该地区人口预测结果,2020年该地区基于劳动力需求的经济类适度人口容量为878万,资源类适度人口容量为915万,生态环境类适度人口容量为643万,代入上述公式,求得该地区2020年适度人口容量为812万人。

二、犯罪预测

(一)预测原则

针对该地区犯罪样本数据量小、不连续等特点,并且统计不完全现状,本项目采用Logistic曲线拟合和等维递补灰色预测理论,预测该地区犯罪数量(或犯罪人口)的增长情况。首先,在该地区人口规模的高、中、低方案预测基础上,通过Logistic曲线拟合与外推,掌握该地区犯罪人口增长的总趋势。其次,选定不同长度的历史犯罪数据序列以建立多个等维递补灰色模型,检验并分析各种预测结果的合理性与不足。最终,确定该地区犯罪规模增长预测的高、中、低方案。实践表明,灰色等维递补预测法对“小样本”“贫信息”的犯罪预测是切实可行的。

20世纪90年代初以来,我国学者也从不同角度开展了人口犯罪问题研究,并取得可喜成果。但就总体上来看,上述理论模式多偏重于定性说明与解释,即便有数学模型,也因过于简单仅考虑两个地区间的人口犯罪,或数据获取困难,而无助于城市犯罪人口的定量预测。目前,犯罪人口定量预测方法可粗略分为两类:因素解析法和趋势预测法。所谓因素解析法,就是先剖析犯罪人口的内部结构,例如:性别结构、年龄结构、就业结构等,将全部犯罪人口划分为若干组成部分,再分别对各个部分作预测,最后汇总求得犯罪人口的总量。相反,趋势预测法就是只分析以往犯罪人口的总量数据资料,运用数学方法揭示其数量变化规律,进而推出未来一段时期的变化趋势。例如,数学函数拟合法线性函数、指数函数、 Logistic曲线等、 GM (1,1)模型、神经网络预测法,等等。此外,也可根据常住人口与犯罪人口之比例来推断未来犯罪人口数量,由于此法误差太大,一般不用。在实际研究工作中,上述两类方法都有运用的案例,有成功也有失败。但是,倘若系统的结构复杂,影响因素众多,且相互交织在一起,或者系统各个部分变化剧烈、难以预料,那么趋势预测法所固有的整体性思维的优势就将凸显出来,预测结果往往较为理想。正是基于上述思想,本研究综合运用等维递补灰色预测法和Logistic曲线拟合法,建模预测该地区犯罪人口的增长变动趋势。

(二)基于灰色理论的预测方法

灰色理论是由我国学者邓聚龙于20世纪80年代提出,用于控制和预测的新理论和新技术。与研究“随机不确定性”的概率统计和研究“认知不确定性”的模糊数学不同,灰色系统理论的研究对象是“部分信息已知,部分信息未知”的“小样本”“贫信息”的不确定性系统。其次,一般统计方法依据随机原则进行抽样调查,以获取大量样本;而灰色理论则遵循现实优先的原则,即注重对系统未来发展趋势起主导作用的现实信息。再者,灰色系统模型对试验观测数据及其分布并无特殊要求和限制。

综上所述,灰色理论并不要求大量的历史数据,甚至有3 ~ 4个数据即可建模预测。灰色理论已初步形成了较为完善的一套模型、方法和技术体系。灰色预测是其中的重要应用之一,主要包括数列预测、系统协调预测、突变预测、季节灾变预测和拓扑预测等。灰色数列预测主要是指利用GM模型,对系统的时间序列进行数量大小的预测。灰色数列预测属单数列的预测——只运用预测对象自身的时间序列,而与预测对象相关联的其他因素没有参与运算和建模。因此,灰色数列预测特别适用于因素众多、结构复杂、互补性好、涉及面广、层次较高、综合性强的社会经济系统及其主行为特征的预测。

一般情况下,通过数据序列长度的取舍以获得不同的预测结果,从而组成一个预测灰区间——灰靶,供决策者选择使用。倘若数据序列较短,仅4 ~ 5个,便难以建立长期的预测模型;数据变化较大,模型所得灰区间过大而失去意义;系统明显受外部因素的控制与干扰,等等。如此种种情况,都会导致GM (1,1)模型的直接预测结果差强人意。此时,可用“等维递补灰预测法”弥补直接建模法之不足。

1.等维递补灰预测法

所谓等维递补灰预测法,是指只用已知数列建立的GM (1,1)模型的第一个预测值,而非全部采用。将其补充在已知数列之后,同时为不增加数据序列的长度,去掉数列的第一个已知数值,保持数据序列的等长等维,建立新的GM (1,1)模型以预测下一个值,再将预测值加入数据序列之后,同时去掉该数列的第一个数据。如此逐个预测,依次递补,直到完成预测目的或达到一定的精度要求为止。所以,等维递补灰预测法的优势可概括为两个方面。首先,及时补充和利用新的信息,提高灰色区间的白化度,即使是预测灰数,在多数情况下也是有效信息。当然,这种递补并非无止境的,因为灰度也随着递补次数的增加而增大,有用信息量在减少。其次,每预测一步灰参数作一次修正,模型得到改进。如此,在灰参数不断修正的同时,模型也逐步改进,因而预测值都产生于动态之中。

2.数据预处理

等维序列预测适合于对增长迅猛的时间序列进行数量大小的预测,为减小原始数据随机波动影响,先要对原始数据进行平滑处理,这里采用三点平滑法。为了避免小数循环,采用如下公式计算。

X (0) (t) = {X (0) (t-1)+ 2X(t) + X(t + 1)}/4

两个端点分别为:

X (0) (1)= {3X (0) (1)+ X (0) (2)}/4

X (0) (m) = {X (0) (m-1)+ 3X (0) (m)}/4

3.数列 X 建模的可行性检验

对于欲建模的数列 X (0) ,可否建立精度较高的GM (1,1)模型,一般用 X (0) 级比 σ (0) k )的大小与所属区间,即其覆盖来判断。若级比 σ (0) k ) ,满足 σ o )( k ,其中 则认为该数列 X (0) 可作GM (1,1)建模。

(三)犯罪人口数据的特点与选择

由于样本数据不连续,从1990—2009年间,该地区犯罪数量的调查统计是间断性的,无法建立一个完整的时间序列。自2005年该地区才开始犯罪人口的动态监测,方可构建2005—2009年的犯罪人口短时间序列。此外,样本数据量偏小,信息量少,1990—2009年间,样本数据共有10个。

显然,上述数据量少、残缺不全和不连续等特点,造成普通的时间序列建模和预测方法无法使用。但是,依据灰色预测的短序列、现时性和贫信息难以准确界定影响因素及其影响大小等特点,易知灰色数列预测法对该地区犯罪人口预测较为合适。而且,将多个预测模型结合使用,可提高预测的准确性与可信度。为此,本研究依据建模要求,对现有数据进行选择与处理,然后采用灰色数列等维递补法建模并预测。此外,辅以Logistic曲线拟合预测法,最终确定该地区未来犯罪人口的变动情况。建模所用数据与方法如下。

采用Logistic曲线拟合与外推。城市环境容量有限,犯罪人口增长率也随着密度上升而降低。因为城市犯罪人口系统就如同生态系统中的种群,其数量增长理应符合“与密度有关的种群增长模型”,这种“慢—快—慢”的增长变化趋势可用生长曲线来描述, Logistic曲线是其中最为典型的一种。所以,本研究通过Logistic曲线拟合与外推,确定犯罪人口变动的总体趋势,以辅助灰色预测。由于各种原因所致,2009年的犯罪人口数值过大,从20年的全过程和实际拟合结果来看,它是一个异常值。所以,作Logistic曲线拟合时将2009年犯罪人口数据忽略不用。

通过插值运算求得2003年和2004年的犯罪人口总数,从而建立2002—2008年的连续序列,再用等维递补法建模预测。之所以选择2002—2008年时间段,主要原因有:遵循“平稳信息优先原则”,2002—2008年的数据变动不大比较准确可信;灰色建模维数不宜太大,5 ~ 8个数据较为适宜。研究表明,数列维度,即数列的长度不等则预测结果必然不同。所以,应采用“变长等维递补灰色预测”——分别采用不同维数的数列来建模,并通过实际值的检验以确定适宜的序列长度及预测模型。

采用2005—2008年的4个短序列数据构建等维递补灰色模型。因为这4年数据可信度高,所含信息量最大,对未来影响也最强;4个数据已满足灰色建模用“小样本”数据作预测恰恰是等维递补灰色预测法的特长。

(四)数据分析、建模与预测

2005—2008年的Logistic曲线拟合与预测Logistic曲线拟合法,实质就是以时间T为自变量建立的回归模型——倾向线的拟合。由于犯罪人口增长符合生态系统中种群的增长变动规律,故其总体趋势为非线性的S形增长。 S形增长曲线主要有Logistic曲线和Gompertz曲线。由于Gompertz曲线更适用于拟合与预测那些本身发展密切依赖于人口数量的增减和居民消费能力高低的产业的发展过程, Gompertz曲线趋于极限 L 的速度较慢,而且用它们对大连市犯罪人口的拟合效果十分相近,所以选用Logistic曲线更为合适。我们采用的Logistic曲线拟合是在DPS数据处理系统辅助下完成的,它运用非线性最小二乘法Marquardt法,从而避免在估计 K a r 值时的相互依赖性,使曲线参数有客观标准,拟合精度大大提高。

曲线拟合与外推 Y = K/ [1 + a × exp( - rt )]这个Logistic曲线方程是美国生物学家和人口统计学家Pear在大量研究生物繁殖和生长过程、各国人口增长情况之后提出的,它是用于模拟生长过程的数学模型。采用表4-3中的数据(2006年除外),用DPS软件作拟合所得的Logistic曲线方程为:

Y = 789. 6252 /[1 + 23. 5601 × exp(-0. 112405 × t)]

其中,确定系数较大 R = 0. 9731,回归方程统计检验达极显著水平 P <0. 001,认为拟合效果较为满意。

由于Logistic模型是基于长期数据建立的,它反映的是渐进式变化趋势,而排除了随机变动部分。所以,用该模型做的外推结果数值偏小,趋于保守。在该模型中, K = 5. 6252万人, K 的理论意义是曲线的水平渐近线,此外,代表犯罪人口总数的增长极限,从该地区环境容量来看,这个结果符合实际情况。对于Logistic模型 y K/ 1 + a × exp2 rt ,将其在区间(0, K )中的拐点记为( t y ),易知: t = lna/ r, y K / 2。拐点是事物由高速发展变为缓慢发展的转折点,在拐点之后则意味着事物的发展速度逐渐减慢,处于发展和成熟阶段。在该地区犯罪人口Logistic模型中,其拐点为(28. 0987,394. 8126),这说明大连市犯罪数量在2013年和2014年之间增长速度最快。这之前为快速发展阶段,呈加速发展状态,这个结果完全符合2010年之前的犯罪人口增长情况。

显然,2015年之后的犯罪数量变动的总体趋势应该是逐渐减慢。所以,在做灰色建模预测时,犯罪人口增长率也应该呈逐渐降低的渐变过程,才是符合实际情况的。下面建立的多个灰色模型都充分考虑到这一点,以求预测更为准确可靠。

(五)2011—2015年的短序列灰色建模与预测

根据大连市实际犯罪数量的调查分析,对2005—2009年的犯罪统计数据进行修正,得出表4-3的犯罪数据。

表4-3 2005—2008年修正的犯罪率

根据 Y = 789. 6252 /[1 23. 5601 × exp(-0. 112405 × t )],将该模型用于外推预测。所得结果见图4-2。

图4-2 该地区2011—2015年实际犯罪数预测

我们采用同样的方法得出该地区2011—2015年违法数的预测值,所图4-3所示:

图4-3 该地区2011—2015年实际犯罪数预测 IP/9YhSkbgm1uTKClB6Y7ExjLDKGy9hUQQrQTDMfmCYdS4WJGh1Alq9WLhwLPtSN

点击中间区域
呼出菜单
上一章
目录
下一章
×