中国金融类指数的构建与货币政策非对称性效应分析最新章节_肖强著

2.2 因子的估计

最初的工作是Geweke（1977）和Sargent和Sims（1977）利用频域分析方法寻找动态因子结构的依据和估计重要的因子。但这些方法不能直接得到因子f _t 的估计值，也就不能用于预测。所以随后关于动态因子模型的研究主要集中于可以直接得到f _t 的估计值的时域分析方法。主要可以分为以下几种方式：第一种是针对低维（N较小）的DFMs，将其写成线性状态空间模型，通过卡尔曼滤波，利用Gaussian MLE，也可采用EM算法（参数的个数与变量的个数N有关，对N很大的问题不易处理）。第二种是对高维数据（N较大）利用非参数均值法（主成分估计，动态主成分估计）。第三种将状态空间模型的统计有效性和主成分的稳健性结合。第四种对DFMs的未知参数和因子的估计采用基于MCMC的贝叶斯方法。以下具体来看各种估计方法。

第一，针对变量比较少的动态因子模型，通过卡尔曼滤波的极大似然估计和EM算法。首先将DFMs改写成线性状态空间模型。如：

这里（2.1）称为量测方程（measurement equation），（2.2）称为状态（系统）方程（state equation）。假定e _t 和η _t 独立且服从正态分布，对应协方差阵分别为Q和R。

卡尔曼滤波的基本思想是：以最小均方误差为最佳估计准则，采用信号与噪声的状态空间模型，利用前一时刻的估计值和当前时刻的观测值来更新对状态变量的估计，求出当前时刻的估计值。算法根据建立的系统方程和量测方程对需要处理的信号做出满足最小均方误差的估计。从建立的系统数学模型出发，可以导出卡尔曼滤波的计算模型，包括：时间更新方程和测量更新方程。为了便于描述，做以下记号：（1），表示第步之前的状态已知的情况下第步的先验状态估计值（-代表先验，＾代表估计）；（2），表示测量变量Xk已知情况下第k步的后验状态估计值。由此定义先验估计误差和后验估计误差为：

先验估计误差和后验估计误差对应的协方差矩阵分别为：

下式构造卡尔曼滤波器的表达式：此处假定相关参数λ（L）、ψ（L）、Q和R是已知的，随后会给出如何由数据估计这些参数。先验估计，测量变量X _k 减去的加权线性组合构成了后验状态估计：

式中测量变量与其预测值之差反映了预测值和实际值之间的不一致程度，称为测量过程的残余。矩阵K叫作残余的增益，作用是使上式中的后验估计误差协方差最小。K的一种形式为：

卡尔曼滤波器包括两个主要过程：预估与校正。预估过程主要是利用时间更新方程建立对当前状态的先验估计，及时向前推算当前状态变量和误差协方差估计的值，以便为下一个时间状态构造先验估计值；校正过程负责反馈，利用测量更新方程在预估过程的先验估计值及当前测量变量的基础上建立起对当前状态的改进的后验估计。这样的一个过程，我们称之为预估—校正过程，对应的这种估计算法称为预估—校正算法。以下给出离散卡尔曼滤波的时间更新方程和状态更新方程。

时间更新方程：

状态更新方程：

如果赋予第k期的先验值，则可得到f _k 卡尔曼滤波的值。类似地，可

以得到因子和估计误差的卡尔曼滤波值和。

并且

写出完全信息的似然函数，将迭代得到的序列用于似然函数，进而利用极大似然估计的数值方法可求得模型参数的估计值。

状态空间模型的优点是可以处理不规则数据。也可以用EM算法计算未知参数的估计值。Zuur等（2003）给出了含有解释变量的动态因子模型的卡尔曼滤波和平滑，及EM算法。具体如下，假定含有解释变量的动态因子模型：

其中，。

设，，

其中E ₁ ＝C，，。

卡尔曼滤波算法如下：

初值：α _{0 ｜0} 和V _{0 ｜0}

重复预测和修正的步骤，t ＝ 1，2，…，T

预测的步骤：α _t _{｜ t-1} ＝α _t _{-1 ｜ t-1}

修正的步骤：K _t ＝V _t _{｜ t-1} Γ′（ΓV _t ｜ _t-1 Γ′＋H） ^-1

卡尔曼平滑算法如下：

初始值：

重复平滑过程，t ＝T，T-1，…，2

平滑过程：

其中，。

EM算法如下：

对不完全信息的y ₁ ，y ₂ ，…，y _T 的对数似然函数：

其中，C为常数，F _t ＝ΓV _t _{｜ t-1} Γ′＋H，容易由卡尔曼滤波得到的α _{t｜ t-1} 和V _t _{｜ t-1} 计算。

（1）选择初始变量：H，Γ，α ₀ ，D和V ₀ （对角线上均为 5），记为H ⁰ ，Γ ⁰ ，，D ⁰ ；

（2）对p ＝ 0，1，2，…

第p步，利用卡尔曼滤波估计和，令为的均值，；

第p ＋ 1 步，更新参数H，Γ，α ₀ 和D，记为H ^{（p ＋ 1）} ，Γ ^{（p ＋ 1）} ，和D ^{（p ＋ 1）} 。当logG＜ 0.000001 时停止循环。

（3）将最后所得到的参数值作为相关参数的估计值。

第二，对变量较多的因子模型，利用非参数均值方法。针对静态因子模型：

Chamberlain和Rothschild（1984）假定了条件：

（D _Λ 为满秩矩阵，保证了因子的遍历性和因子载荷的异质性）

（其中max eval表示特征值的最大值，保证异质性扰动之间有限相关）

考察典型均值方法的原理。认为F _t 的估计值利用非随机矩阵W对X _t 的加权平均得到，这里W是已标准化的，使得W′W／N＝I _r ：

当N→∞时，N ^-1 W′Λ→H，其中H是满秩矩阵。如果满足以上假定条件，则在F _t 所张成的空间中是一致的。

第三，对变量较多的因子模型，也可以利用主成分估计。F _t 的主成分估计为：

其中，这里是由X _t 样本协方差矩阵的r个最大特征值对应的特征向量组成。

主成分的估计可以通过求下面的最小二乘问题得到：

满足标准化。给定Λ，最小化上式得到

这时上式为

等价于

也等价于满足Λ′Λ／N＝I _r 的条件下，求。可得由 XX最大的r个特征值对应的特征向量组成。因为，可得

第四，Bayes估计。采用Bayes方法估计DFMs主要有三个动机：第一，当未知参数很多时，积分计算后验值要比极大似然容易和稳定；第二，在非线性或非Gaussian潜变量模型时，利用MCMC方法可以计算后验潜变量模型，但似然不能直接计算；第三，某些分析可以期望提供模型的先验分布的形式。Bayes估计基于MCMC法估计参数和因子。Chib（1996）奠定了Gibbs抽样应用于线性状态空间模型的基础。