在前面的分析中,被解释变量主要受可以直接度量的定量因素的影响,如收入、产出、商品需求量、价格、成本、资金、人数等。但现实经济生活中,影响被解释变量变动的因素,除了可以直接观测数据的定量变量外,可能还包括一些本质上为定性的因素,例如性别、种族、职业、季节、文化程度、战争、自然灾害、政府经济政策的变动等。在实际的经济分析中,这些定性因素有时具有不可忽视的重要作用。例如,研究居民收入水平时,职业、性别、文化程度、地域等因素,通常是值得考虑的影响因素。因此,在计量经济学的建模中有时需要将定量因素和定性因素同时纳入模型之内。
定量因素是指那些可直接测度的数值型因素,如国内生产总值GDP、广义货币供应量M2 等。定性因素,或称为属性因素,如男性或女性、城市居民或非城市居民、气候条件正常或异常、经济政策不变或改变等。这类定性因素有共同的特征,即它们表示的都是某种属性,是说明某种属性或状态存在与否的非数值型因素,属性因素的类型或状态水平往往也是“非此即彼”的,而且不能直接用可观测的数据精确测度与描述。
为了在模型中反映定性因素,可以引入虚拟变量作为表现定性因素不同状态的变量。虚拟变量是人工构造的作为属性因素代表的变量,通常用字母 D (或dummy的缩写DUM)表示。一般情形下,虚拟变量的取值为 0 和 1。当虚拟变量取值为 0,即 D = 0 时,表示某种属性或状态的类型或水平不出现或不存在;当虚拟变量取值为 1,即 D = 1 时,表示某种属性或状态的类型或水平出现或存在。例如,构造政府经济政策的虚拟变量,当某经济政策不变时,虚拟变量取值为 0,当某经济政策改变时,虚拟变量取值为 1。这种做法实际上是一种变换或映射,将不能精确计量的定性因素的水平或状态用 0 和 1 来描述。
在计量经济学中,把包含有虚拟变量的模型称为虚拟变量模型。常用的虚拟变量模型有三种类型:①解释变量中只包含虚拟变量,作用是在假定其他因素都不变时,只研究定性变量是否使被解释变量表现出显著性差异;②解释变量中既含定量变量,又含虚拟变量,研究定量变量和虚拟变量同时对被解释变量的影响;③被解释变量本身为虚拟变量的模型,是被解释变量本身取值为 0或 1 的模型,适用于对某社会经济现象进行“是”与“否”的判断研究。
计量经济模型中引入虚拟变量,可以使我们兼顾定量因素和定性因素的影响和作用,但是,由于定性因素通常具有多种类型或水平,在设置虚拟变量时应遵循一定的规则。
虚拟变量 D 取值为 0,还是取值为 1,应从分析问题的目的出发予以界定,要注意区分所代表的是基础类型还是比较类型。虚拟变量取“0”,通常代表作为比较基础的类型;虚拟变量取“1”,通常代表与基础类型相比较的类型。若一个定性因素有 m 个相互排斥的类型(或属性、水平)时,按照模型设定中有无截距项,虚拟变量个数的设置规则分为两种情况:①在有截距项的模型中,只能引入 m - 1 个虚拟变量,否则会陷入所谓的“虚拟变量陷阱”,产生完全的多重共线性;②在无截距项的模型中,可以引入 m 个虚拟变量,而不会导致完全的多重共线性。
在计量经济模型中,引入虚拟解释变量的途径有两种基本方式:一是加法方式;二是乘法方式。应当注意的是,不同的途径引入虚拟变量有不同的作用,以加法方式引入虚拟变量可能改变原有模型的截距;以乘法方式引入虚拟变量可能改变原有模型的斜率。
以加法方式引入虚拟解释变量的模型一般形式为
Y t = α 1 + α 2 X t + α 3 D + ut
其中 X 为定量变量, D 为虚拟变量。
以乘法形式引入虚拟解释变量,是在所设定的计量经济模型中,将虚拟解释变量与其他解释变量相乘作为解释变量,以表示模型中斜率系数的差异。以乘法形式引入虚拟解释变量的主要作用有:①结构变化检验;②交互效应分析;③分段回归。
(1)结构变化检验——回归模型的比较
Y t = α 1 + α 2 Dt+ β 1 X t + β 2 ( D t X t ) + u t
在基本假定下,可用OLS估计各参数,并着重检验参数 α 2 和 β 2 是否显著为零,以比较 D 取 0 或 1 的状态下是否有显著差异。
(2)分析不同的虚拟解释变量对被解释变量的交互效应,则引入两个(或多个)虚拟解释变量的乘积,如
Y i = α 1 + α 2 D 2 i + α 3 D 3 i + α 4( D 2 i D 3 i ) + βX i+ u i
估计各参数,并着重检验描述交互作用的参数 α 4 是否显著为零。
(3)建立分段回归模型,分析检验不同阶段是否需要不同的回归模型。具体内容不在此赘述。
【例 2.5】随着经济的快速发展,我国私人汽车拥有量持续增长,近年来更是以每年千万辆的速度增长。表 2.4 选取了 1990—2018 年中国私人汽车拥有量、城镇居民人均可支配收入、公路里程数、公路运营汽车拥有量、原油产量以及一年期贷款利率等相关数据,对中国私人汽车拥有量的主要影响因素进行分析。
表2.4 中国私人汽车拥有量等变量数据
表2.4(续)
数据来源:根据《中国统计年鉴》数据整理。
2001 年 12 月,世界贸易组织(WTO)正式宣布中国成为世界贸易组织的一员,中国市场能与国际市场相连接,这极大地促进了中国经济的发展和人民的生活水平的提高。这一变化同样也可能会影响到中国的私人汽车拥有量。我们尝试以 2001 年年底加入WTO为转折点,在私人汽车拥有量的对数ln Y 对城镇居民可支配收入的对数ln X 2 以及公路里程等变量进行回归的基础上,引入虚拟变量,建立以下多元回归模型:
ln Y t = β 1 + β 2 ln X 2 t + β 3 X 3 t + β 4 X4 t + β 5X 5 t + β 6X 6 t + β 7D 2 t + u t
式中
操作过程如图 2.6 所示,回归结果如图 2.7 所示。
图2.6 操作过程
图2.7 回归结果
从回归结果可以看出,模型的解释变量有的显著有的不显著,但虚拟变量 D 2 t 的经济意义并不显著,即加入WTO,对我国私人汽车拥有量并没有显著影响。
需要指出的是,在上述建模过程中,主要是从教学目的出发,说明运用虚拟变量的规则和方法,没有考虑更多建模的可能性。在实证分析中,还可以进一步考虑分段回归(以虚拟变量分辨更多的分段点)以及是否存在多重共线性对模型的影响等。
虚拟被解释变量及相应的离散选择模型将在后续章节中介绍。