(一) Dagum基尼系数及其按子群分解方法
地区差距的测度方法较多,常用的有基尼系数、泰尔指数、变异系数等方法。但这些方法或是不能进行地区差距的分解或是未考虑子样本的分布状况 [62] ,存在一定的缺陷。而Dagum在1997年提出的基尼系数按子群分解方法能够有效地解决上述问题,因此本部分采用该方法测算我国居民信息消费的地区差距情况。
根据Dagum (1997)对基尼系数的定义,一国划分为k个地区,共包含n个省份, c、 d分别代表不同地区, n c 、 n d 分别为c和d地区内省份个数, y c i 和 y d j 分别表示c地区和d地区内任意一个省份的居民人均信息消费支出, 是全国居民人均信息消费支出,其计算公式如式(1)所示。进行Dagum基尼系数分解前,先要对划分地区的居民信息消费均值进行排序,即 ,其中 表示c地区居民信息消费的均值。
Dagum (1997)将基尼系数分解为三个部分:一是地区内(组内)差距贡献( G w ),二是地区间(组间)超变净值差距的贡献( G nb ),三是地区间(组间)超变密度的贡献( G t ),三个部分的关系满足: G = G w + G nb + G t 。本部分中地区间贡献 G nb 表示东、中、西部地区间居民信息消费水平的差异;地区内差距贡献 G w 表示某一地区内部各省间居民信息消费水平的差异;超变密度 G t 表示三大地区间信息消费水平交叉影响的一种基尼系数余数。 G cc 和 G cd 分别表示c地区内基尼系数和c、 d两个地区间基尼系数,计算公式如(2)和(3)所示, G w 、 G nb 、 G t 的计算公式如(4)(5)(6)所示。
其中, p c = , s c = c = 1,2,..., k,并且 = = 1, k c = 1 ∑ k 。
D cd = 表示c和d两地区间人均信息消费支出的相对影响,且 。 d cd 表示c和d地区间人均信息消费支出贡献率差值,即在 时,在 y c i 条件下的所有样本值差距 y c i - y dj 的加权平均数,如公式(7)所示; p cd 表示超变一阶矩,可以理解为在 时,在 条件下的所有样本值差距 y dj - y ci 的加权平均数,如公式(8)所示。
根据以上的测算方法,我们得到我国31个省份2000—2015年居民信息消费的Dagum基尼系数并进行地区分解。
(二)数据来源及处理
关于信息消费的定义,迄今尚没有明确的标准。在统计口径方面,学者们有以下几种处理办法:(1)参照小松崎清提出的信息化指数法,将信息消费界定为“个人消费中除去衣、食、住以外的其他杂费消费” [59] ,但这种方法囊括了较多与信息无关的消费,界定范围过宽 [55] 。(2)将居民交通通讯、娱乐文化教育两项消费支出加总作为居民信息消费额,此方法有一定的合理性,但界定范围较窄,不能客观反映我国居民信息消费水平。(3)采用尹世杰(2007) [63] 对广义信息消费的定义,即居民信息消费由医疗保健、交通通信、文化教育娱乐用品与服务三项消费支出加总得到,使用此方法量化信息消费虽与其本意有一定的出入,但信息消费在其中占有绝对大的比重,而且随着科技进步,上述三项消费中信息含量越来越多,这样处理得到的信息消费额误差较小,也被多数国内定量研究所采用。综合考虑各种统计方法的优缺点,并兼顾数据的可获得性,本部分对信息消费的统计借鉴第三种做法。考虑到一个地区的信息消费总量一般与此地人口数量关系密切,因此本部分选择居民人均信息消费支出 分析为消除物价变动因素影响得到我国实际人均信息消费数据,笔者以2000年为基期的各地区居民消费价格指数,对相应地区数据进行平减。数据来源为《中国统计年鉴2001-2016》和wind数据库。