简单地说,空间计量经济学(spatial econometrics)就是空间经济的计量。自从20世纪70年代一些欧洲学者开始进行空间计量经济研究以来,空间计量经济学已经成为空间经济学及其相关学科的重要学科基础,成为经济学学科的一个新兴分支。本章将主要讨论空间计量经济学的发展(模型驱动和数据驱动)及其与相关学科(包括空间统计学和计算经济学等)的关系,空间计量经济学的学科体系、基本概念(空间异质、空间关联与空间经济计量)以及空间计量经济的作用。
空间计量经济学是以空间经济理论和地理空间数据为基础,以建立、检验和运用经济计量模型为核心,运用数学、统计学方法与计算机技术对经济活动的空间相互作用(空间自相关)和空间结构(空间不均匀性)问题进行定量分析,研究空间经济活动或经济关系数量规律的一门经济学学科。
一、空间数据不断丰富驱动空间计量经济发展
20世纪60年代以来,随着地理信息系统和遥感等技术的飞速发展,空间数据量极大地丰富,且以指数方式不断增长,这使得传统计量经济学面临空间数据丰富而计量分析不足的尴尬局面,迫切需要科学、精确地分析这些数据,计量经济学的热点由时间序列数据转向空间数据。而空间计量经济学就是空间数据分析的重要理论与方法之一。
二、空间数据计量和知识发现推动空间经济认识深化
空间数据具有不同于一般数据的特质,即数据的空间关联性、空间和时间上的多尺度性、数据表达的不确定性等,这使得基于空间数据的计量和知识发现需要空间计量经济理论的支撑。空间数据的计量和知识发现作为计量经济学的一个新的研究分支,是指从空间数据中提取隐含的空间和非空间模式及具有普遍特征的知识的过程。
三、研究领域的确立
Paelinck和Klaassen(1979)定义了空间计量经济学的研究领域,包括在空间模型中对空间相互依赖的设定、空间关系不对称性、空间解释变量的重要性;过去的和将来的相互作用之间的区别、空间模拟等。Cliff和Ord(1973,1981)为空间自回归模型作了开拓性的工作,发展出许多模型、参数估计和检验技术,使得在经济计量学建模中综合空间因素变得更加有效。Anselin为空间经济计量学的发展作出了巨大贡献。他在1988年完成了《空间计量经济学:方法和模型》这本经典著作,对空间经济计量学进行了系统的研究,并将空间计量经济学定义为: “ 在区域科学模型的统计分析中,研究由空间引起的各种特性的一系列方法。”Anselin所说的区域科学模型,是指在模型中综合了区域、位置及与空间相关的影响,并且模型的估计及确定也是具有地理参考意义的(即截面的或时空的)数据,这些数据可能来自于空间上的点,也可能来自于某些区域,前者对应于经纬坐标,后者对应于区域之间的相对位置。
四、模型驱动和数据驱动
长期以来,对区位和空间相互作用问题的研究主要有模型驱动(model driven)和数据驱动(data-driven)两条相互交织的技术路线。
从模型驱动路线看,理论经济学的兴趣越来越从决策主体相互独立的理论模型转向能够明确解释系统中不同主体(参数或效用)相互作用的模型。这些新的理论框架在设定和研究主体间直接的相互作用(用社会学术语说,就是邻近效应、模仿效应或其他看齐效应)时,引发了一个有趣的问题,即个体的相互作用如何导致集体行为和总体模式。在Aoki(1994,1996)的新宏观经济学、社会交互作用的理论模型(Brock和Durlauf,1995;Akerlof,1997)、相互依赖的参数选择(Alessie和Kapteyn,1991)、贸易结构演化模型(Ioannides,1990,1997)、邻近溢出效应(Durlauf,1994;Borjas,1995;Glaeser、Sacerdote和Scheinkman,1996)、尺度竞争(Besley和Case,1995;Bivand和Szymanski,1997)等领域中,这些理论模型都有发展,并和研究粒子系统相互作用和随机场模型的统计力学原理(统计力学后来形成了空间统计学中马尔可夫场模型的基础)一起,支撑了研究主体间重要相互作用的实证模型,如Case、Rosen和Hines(1993);Murdoch、Sandler和Sargent(1997);Brueckner(1998)。相关文献重新研究了与新经济地理学有关的马歇尔外部性、集聚经济及其他溢出效应等空间特征,并进一步发展了相互作用模型(阿瑟,1989;Krugman,1991,1998;Glaeser等,1992)。
另一条路线是随着空间数据及其处理技术的驱动而开展实证研究。地理信息技术的推广和相关的地理编码社会经济数据(如包含被观察单元位置信息的数据)推动了处理地理数据独特特征(主要是空间自相关特征)的专门技术的发展(Anselin,1989)。这种专门技术是由于认识到地理(横截面)数据的空间自相关性以及标准计量经济学难以处理空间自相关而得以快速发展的。目前,在应用经济学研究和公共政策分析领域,特别是在房地产经济学(Anselin,1998;Can,1998)、资源与环境经济学(Bockstael,1996;Geoghegan、Wainger和Bockstael,1997)以及发展经济学(Nelson和Gray,1997)研究中,常常采用地理信息系统进行空间数据分析和空间经济建模。
空间计量经济学是利用经济理论、数学、空间统计推断等工具对空间经济现象进行分析的一门社会科学,是空间经济理论、空间统计学与数学三者的有机结合,与这些学科既互有交叉和关联,又各有侧重。但正如弗里希在《计量经济学》的创刊词中说道: “ 用数学方法探讨经济学可以从好几个方面着手,但任何一方面都不能与计量经济学混为一谈。计量经济学与经济统计学绝非一码事;它也不同于我们所说的一般经济理论,尽管经济理论大部分都具有一定的数量特征;计量经济学也不应被视为数学应用于经济学的同义语。 ” 一般认为,与空间计量经济学具有密切关系的学科主要有空间统计学(spatial statistics)、计算经济学(computational economics)和地理信息系统(GIS)。
空间统计学起源于20世纪50年代早期,用于对地理空间中的地理对象进行统计分析,进而描述、解释、预测地理现象的状态、过程及其发展方向。最早的空间统计工作是采矿工程师D.G.Krige和统计学家H.S.Sichel在南非进行的,用以帮助采矿业进行矿藏量的计算。随着计算机的普及以及运算速度的大幅提高,空间统计学已经普遍应用于需要处理存在与空间相关的数据的科技领域中。空间计量经济学与空间统计学难以区分。Haining认为,空间统计学的研究大多由数据驱动,而空间计量经济学主要由模型驱动,即从区域经济学理论出发,主要研究与区域及城市经济有关的模型,重点放在问题的估计、解释和检验。而空间统计学较少直接研究区域科学中的具体问题。
计算经济学起源于20世纪90年代中后期,是关于求解标准经济模型计算方法的科学,主要用于在计算机模拟实验环境中建立的由大量独立个体(agent)构成的演化系统模型。与空间经济系统中不同区域之间相互影响的过程类似,基于Agent的计算经济学(ACE)模拟系统中所有Agent相互竞争、相互影响、共同演化,形成一个复杂的动态演化系统。由此可以看出,基于Agent的计算经济学在逻辑推理方式上与空间计量经济学的差异:ACE模型是由大量独立个体自下而上构成的,属于归纳推理的范畴,研究结论的获得依赖于大量的模拟实验。而空间计量经济学的研究方法是通过设定一系列前提假设,建立描述空间经济现象的数学模型,再针对这些模型求解最优路径问题以得到系统的均衡条件等特征,最后再通过实证检验得出结论。从逻辑基础的角度来说,这种研究方法属于自上而下的演绎推理的范畴。
GIS是20世纪70年代后期发展起来的,对地理数据进行采集、输入、存贮、更新、检索、管理及综合分析与输出的计算机应用技术。它是以计算机为工具,综合应用定位观测数据、统计调查数据、地图数据、遥感数据等,通过一系列空间操作与分析,对地理学进行综合研究的现代化手段。一方面,空间经济计量不仅需要大量地理数据构成的数据库的支持,还需要强有力的计算方法与计算机程序的支持,而且由模型系统运行所得到的研究结论也需要以简明扼要的形式——地图、统计图形或表格方式被输出。显然,对于模型的这些支持,必须由GIS技术才能完成。另一方面,空间经济计量只有很好地与GIS技术相结合,才能不断地提高其应用层次与水平,不断地拓宽其应用领域,充分发挥其在区域经济和新经济地理研究中的作用。
由此可见,作为研究区域经济问题的理论与方法,空间计量经济学以空间统计学和地理信息系统等学科为基础,以探索建立空间经济理论模型为主要任务,通过空间经济计量所建立的理论模型为计算经济学进行模拟实验和理论推演提供了前提。空间统计学、空间计量经济学、计算经济学都是数学化时代采用地理信息系统手段探索空间经济规律的重要理论与方法。
与计量经济学包括理论计量经济学和应用计量经济学一样,空间计量经济学也包括理论空间计量经济学和应用空间计量经济学。
理论空间计量经济学主要研究空间权重的设定及如何运用、改造和发展数理统计的方法,使之成为测定空间随机经济关系的特殊方法,包括各类空间回归模型——特别是横截面数据(地理数据)和面板数据 (时空数据)回归模型(Paelinck和Klaassen,1979;Anselin,1988)——的设定、估计和检验方法。相关模型研究有相邻溢出效应模型,均值域相互作用宏观模型,以及报酬递增、路径依赖和不完全竞争等新经济地理模型。
应用空间计量经济学是在一定的空间经济理论的指导下,以反映事实的空间数据为依据,用经济计量方法研究空间经济数学模型的实用化或探索实证空间经济规律,其具体研究内容包括方法应用及软件平台开发。
最近二三十年随着Anselin、Brueckner、Kelejian、Haining、Case等人的不懈努力,以及计算技术、计算机模拟技术的发展,特别是随着地理信息系统和空间数据分析软件的发展,经济计量研究的重心正逐步从时间序列分析转向空间特性分析,空间计量经济学无论是在理论方法还是在应用方面都取得了突飞猛进的发展,特别是截面数据和面板数据(panel data)回归模型中复杂的空间相互作用与空间依存性结构分析日趋成熟(Anselin,1988)。空间计量经济学的应用领域日趋广泛:一方面在一些专门化的领域中出现了一些明确结合了空间因素的模型以及相应的空间计量经济学应用,如区域科学、城市和房地产经济学、经济地理;另一方面在更多的经济学传统领域的各种经验调查研究中,也越来越多地采用空间计量经济学方法,如需求分析研究、国际经济学、劳动经济学、公共经济学和地方财政、农业和环境经济学等研究领域。此外,在一些涉及计量经济学方法的文献中,对如何处理与结合数据的“地理”属性的模型相适合的备择模型、估计量和检验统计进行了越来越多的讨论。
设W ij 是表示空间位置关系的权重矩阵(如以区域i和区域j是否相邻设定W ij :区域i和区域j相邻时,W ij =1;区域i和区域j不相邻时,W ij =0)。类似于时间序列滞后,可用空间滞后变量建立线性回归模型,解释空间观测变量:
式(1.1)假定独立样本数据中存在空间依赖性,则整个空间样本中y的部分变化将被解释为每个观测量与其相邻观测量的相关性。其中,y表示因变量的观测值(n×1的列向量),代表空间上n个点的观测变量;ρ代表可估计的空间自回归系数,反映样本数据中固有的空间依赖性,以测量y对周边或相邻空间观测量的影响;W代表一个空间权重矩阵;W y 是空间滞后(算子),即随机变量y的加权平均;X表示一个n×k的解释变量的观测矩阵;β是与外生(解释)变量X(n×k)相关的参数向量(k×1);是n×1的随机误差向量,理论上满足:
可以看出,纯空间自回归模型是回归模型的一个特例,解释变量是由一个空间滞后组成,即一阶纯空间自回归模型。通过空间滞后(空间自回归项)来分析空间影响对回归系数的估计和检验产生的影响。但与经典回归模型或时间序列自回归模型不同的是,误差项ε与解释变量W y 相关,加上采用的截面数据经常碰到残差无法满足同方差等经典假设问题,导致普通最小二乘法(OLS)估计不再是有效的估计,通常的统计推断过程不再适用。
这表明,在区域经济分析的过程中,空间依赖的存在打破了大多数古典统计和计量经济学分析中样本相互独立的基本假设,因此直接将古典计量经济学的方法应用于与地理位置相关的数据时,通常不能获取这些数据的空间依赖性,会引起各种问题。因此,在处理空间数据时,要引入一些合适的空间统计和空间经济计量分析方法。当然空间计量经济学也不是抛弃所有的古典经济计量学技术,而是对这些技术加以修改以使它们能够适用于空间数据分析。从这个角度看,空间计量经济学的研究对象是各种空间依赖和空间相互作用现象,横截面数据和面板数据空间回归模型(主要是线性模型)构成了空间计量经济学中组织各种模拟方法的框架。通过对通用模型参数的不同限制,可以导出特定的模型,从而以不同的方式合并空间相关。
空间计量经济模型主要有空间滞后模型和空间误差模型。空间滞后模型通过引入变量的空间滞后形式,将一个空间位置上的变化与周边邻居位置上的变量联系在一起,这在一定程度上解释了由于空间扩散、空间溢出等相互作用造成的空间依赖;而空间误差模型通过将误差项设定为某种空间过程(如空间自回归)的形式,能够将由于测量误差等原因造成的冗余空间依赖加以显式表达。
举例说明,城市和区域经济学认为,经济规模和市场邻近性是影响区域经济的重要因素。如用区域人口规模表征区域劳动力规模和市场规模,用区域工业企业产品销售收入的一阶空间滞后表征区际经济关联,则可对上述理论进行验证。此处利用2006年中国278个地级以上城市的辖区人口(分布见图1.1)及工业企业产品销售收入(分布见图1.2)的一阶空间滞后,估计辖区工业企业产品销售收入,拟合结果见表1.1。
图1.1 2006年全国地级以上城市辖区人口分布
图1.2 2006年全国地级以上城市辖区工业企业产品销售收入分布
表1.1 地级以上城市辖区工业企业产品销售收入的估计结果
注:括号内为标准误,*、**、***分别表示通过1%、5%、10%水平下的显著性检验。
拟合结果表明,R 2 达0.7282,这表明可运用空间依赖性解释地级以上城市辖区工业企业产品销售收入的变化。而一般最小二乘回归的R 2 为0.6964,且其误差呈明显的空间依赖性:东部城市被低估,估计误差偏大(误差分布见图1.3)。也就是说,3%左右的工业企业产品销售收入的变化可以用空间依赖性来解释。此外,当在模型中包含空间滞后变量W y 时,人口规模的系数下降。
图1.3 2006年全国地级以上城市辖区工业企业产品销售收入OLS估计误差分布