对于多元线性回归模型(2.1)
Y = Xβ + u
为了得到参数的最优估计量,有以下的古典假定:
① E ( u | X ) = 0 ( u i 的条件均值为零)
② Var( u | X ) = σ 2 I ( u i 同方差,无自相关,或称球形扰动)
③ E ( X'u ) = 0 (解释变量非随机,或若随机也与 u 不相关,亦称为外生性)
④ Rank( X'X ) = k (满秩性条件,解释变量无共线性,这里 k < n )
⑤ u ~ N (0, σ 2 I ) (扰动项正态分布)
上述古典假定的意义和作用在于:
第一,零条件均值假定,也称强外生性。它可以保证估计量的无偏性。
第二,球形扰动,是指随机扰动项的方差—协方差矩阵为同方差和无自相关同时成立时的情况。违反此假设条件,被称为非球形扰动,将会影响到参数估计的有效性。
第三,外生性条件,表示随机扰动项中不包含有解释变量的任何信息。外生性条件的违反将影响到参数估计的一致性。
第四,满秩性条件,它是为了保证条件期望的唯一性,参数可求解。
第五,正态性条件,它主要与统计检验和推断有关,但在大样本的条件下,根据中心极限定理这个条件是可以放宽的。
在后面的有关内容中,将逐渐放宽这些假设条件,从而对这些假定进行更深入的理解和认识。
在古典假定的条件下,当我们获取样本容量为n的观测数据后,可由样本的回归方程
Y
=
X
+
e
,通过普通最小二乘估计法(OLS),得出未知参数
β
的优质估计量
。
最小二乘估计法的基本原理是,寻求使残差(扰动项的估计)平方和
e'e
达到最小的
,即
min e'e =
=
于是
=
= 0
则有
这就是最小二乘估计法估计的结果。仅估计结果的过程而言,古典假定很多没起作用,只需要 X ' X 满秩。而估计效果好坏的基本要求和准则是“尽可能地接近”原则,即参数估计量的值应尽可能地接近总体参数的真实值。决定参数估计效果的统计性质是无偏性、有效性和一致性等。
正是在满足相应古典假定的条件下, OLS估计量具有优良的统计性质,即
是
β
的最佳线性无偏估计(BLUE)。
(1)线性特征:最小二乘估计法的参数估计量是被解释变量观测值 Y i 的线性组合。
由式(2.3)可以看出,
等于解释变量构成的矩阵(
X'X
)
-1
X'
与被解释变量Y的乘积,从而是
Y
的线性函数。或者说
是
Y
i
的线性函数。
(2)无偏性:
是
β
的无偏估计。由于
= (
X'X
)
-1
X'Y =
(
X'X
)
-1
X'
(
Xβ + u
)
= ( X'X ) -1 X'Xβ + ( X'X ) -1 X'u
= β + ( X'X ) -1 X'u
对两边取期望,
=
β +
(
X'X
)
-1
X'
[
E
(
u | X
)],
由零均值假定
E
(
u | X
) = 0,则有
=
=
β
,即
是
β
的无偏估计。
(3)最小方差特性:在所有的线性无偏估计中, OLS估计具有最小方差。
的方差—协方差矩阵为
=
'
=
'
= E [( X'X ) -1 X'uu'X ( X'X ) -1 ]
= ( X'X ) -1 X'E ( uu' ) X ( X'X ) -1
= ( X'X ) -1 X'σ 2 IX ( X'X ) -1
= σ 2 ( X'X ) -1
可以证明,它在所有的线性无偏估计量的方差中,它是最小的。(过程略)
最后的结论就是:在古典假定下,多元线性回归的OLS估计量是最佳线性无偏估计量(BLUE)。这就是著名的高斯—马尔可夫定理。
同时,还可以得到
。具体可表述为,在古典假定下,
服从正态分布,即
。其中
c
jj
是矩阵(
X'X
)-
1
中第j行第j列位置上的元素。
而随机扰动项的方差(同方差时)也可估计出来。可以证明,残差平方和具有如下性质(过程略):
=
E
(
ee'
)= (
n - k
)
σ
2
即
是
σ
2
的最小方差无偏估计。
OLS估计是计量经济分析中最基本、最常用且具有良好统计性质的估计方法。
【例 2.1】研究货币供应量与国内生产总值及通货膨胀等因素的关系:以中国货币供应量(M2)年底余额、国内生产总值(GDP)、居民消费价格指数(CPI,以 1978 年为 100 的定基指数)为变量。从《中国统计年鉴》中取得各变量 2000—2019 年数据作为样本,如表 2.1 所示。
表2.1 各经济变量数据(2000—2019 年)
表2.1(续)
数据来源:2001—2020 年的《中国统计年鉴》。
设定模型 M 2 i = β 1 + β 2 GDP i + β k CPI i + u i
采用OLS估计,运用Stata软件(操作过程如图 2.1 所示)回归输出结果如图 2.2所示。
图2.1 操作过程
图2.2 输出结果图
因此,所估计的样本回归方程为
= 76.946 1 + 2.708 9GDP
i
- 0.212 8CPI
i
即GDP系数的OLS估计值为 2.708 9,置信水平 95%的区间估计是(2.276 9,3.141 0 ); CPI系数估计值为-0.212 8,95%的置信区间为(-0.365 8,-0.059 8)。
如果古典假定满足,由此得到的OLS估计量(值)是最佳线性无偏估计。而且扰动项同方差时,可知其方差的无偏估计是
= 258.429 6 /17=15.201 7。
以上是普通最小二乘估计法的估计过程及其有限样本性质(小样本性质)。即在古典假定下,多元线性回归的OLS估计是最佳线性无偏估计。但是如果古典假定不满足,这个性质则不成立(下一章将讨论这一问题)。不过,这时也可考察OLS的大样本性质,即当样本容量不断增大(或者趋于无穷大)时OLS的性质。
多元线性回归中OLS估计的大样本性质主要包括估计量的一致性及其渐进分布:如果外生性条件满足,即所有解释变量与扰动项无关
E
(
X'u
) = 0 (只需这一条件),在大样本情况下,①OLS估计是一致估计量,即
依概率收敛于
或者
= 0;②OLS估计量服从渐进正态分布,即
依分布收敛于正态分布:
。上述大样本性质理论基础是大数定律和中心极限定理,具体过程在此略去。
矩估计是另一种重要和常用的方法,其基本原理是利用样本矩的信息来替代总体矩,以此得到一致估计量。矩估计虽然古老但仍在广泛应用。矩估计的基本思想是:在随机抽样中,样本统计量是观察的 n 维随机向量即样本 X = ( X 1 , X 2 ,…, X n )的一个函数,且要求它不包含任何未知参数。在不知道总体分布的情况下,利用样本矩构造方程(包含总体的未知参数),利用这些方程求得总体的未知参数。
样本矩的基本定义:
①统计量
为样本
ν
阶原点矩;
②统计量
为样本的
ν
阶中心矩。
就经典线性回归模型,从外生性条件(也称为矩条件)出发,
由外生性条件 E [ X'u ] = 0
有 E [ X'u ] = E [ X' ( Y - Xβ )]= 0
用样本矩替代总体矩:
= 0
由此可得到矩估计量:
它与OLS估计量是一样的。当然它的前提条件是满足外生性的矩条件。我们可以根据矩条件再对最小二乘估计法进行理解,并将矩估计与OLS估计对比进行应用。
关于矩估计的进一步发展——广义矩估计将在后面内容中讲到。同样,点估计的第三种重要方法——极大似然估计将在下一章介绍。