非线性经济时间序列建模最新章节_蒂莫·泰雷斯维尔塔著

4.4　非线性过程的相依性测度

在前面讲解的内容中已经提到，自相关函数不能对非线性时间序列的相依性结构做出充分的描述。条件数量，比如条件均值和条件方差，只是描述了从过去到现在的转换，但是并没有真正地通过扩展自相关函数而建立起测度相依性的方法。当然，（y t , y s ）的联合分布可以描述y t 和y s 之间的相依性关系，但是相依性的强度和方向并不能轻易地从这个函数中推导出来。本节将简要回顾为建立非线性相依性的测度方法所做的不懈工作。这些工作不仅仅限于时间序列方面，但是要把考虑的情形限制在二元变量中，即考虑测度两个随机变量x和y的相依性的问题。

在本节，不得不区分局部和全局的相依性测度。全局相依性测度是用单一的数值说明x和y之间的相依性或依存程度，而局部相依性测度是用实际指标为u和v表征x和y的函数。比如，x和y的大值可能会导致更强的正相依，也就是说，x和y的小值可能仅暗示着弱相依性。显然，自相关函数是相依性的全局测度。

4.4.1　相依性的局部测度

Bjerve和Doksum（1994）所提出的相关曲线是局部测度的例子。同时，也可参阅Blyrh（1994）以及Doksum、Blyth、Bradlow、Meng和Zhao（1994）的文章。他们通过指出这样一个事实：两种金融资产x和y之间的相关性有可能应该取决于x和y如何取值，提出了这种测度方法。对于x和y之间的线性回归关系

y t =α+βx t +ε t

x和y的相关系数ρ x,y 是

其中，σ x 、σ y 和σ ε 分别是x、y和ε的标准差。Bjerve和Doksum（1993）在x=u的条件下，基于局部化ρ提出一个一般化的表征局部相依程度的测度指标，叫相关系数曲线，表达式为

其中， 081-03 ， 081-04 ，并假定条件均值函数m（u）=E{y|x=u}是可微的。他们同样提到，可用位置和规模的其他合适的测度方法替代m（u）和 082-01 。相关系数曲线可以用内核估计方法直接估计，在第13章将对此有所讨论，对于相关的性质和例子可参阅Bjerve和Doksum（1993）的讨论。相关系数曲线的缺点之一为非对称，也就是说，一般情况下ρ x,y （·）≠ρ y,x （·）。对此，作者提出了一个对称的相关系数曲线，但非常特殊。

由Holland和Wang（1987a）提出的局部相依性函数，在Holland和Wang（1987b）中也有所提及，对于x和y是非对称的。把两个随机变量x和y作为起点，它们的局部交叉乘积比率为

其中，P ij =Pr（x=u i ,y=v j ）。结合x和y的边缘分布，系数α ij 唯一决定x和y的联合分布。Goodman（1969）的研究有例子说明，并且其中的参考文献对此有详细介绍。令f x,y 为两个连续变量x和y的联合密度，进一步，让R u,v 表示包含点（u,v）的矩形，且具有长度为Δu和Δv的边，则有

P u,v =Pr{（x,y）∈R u,v }≈f x,y （u,v）ΔuΔv

（4-3）

令θ ij =lnα ij ，并且把代表矩形网络的式（4-3）代入到乘积比率的式（4-2）中，当Δu，Δv→0时，可以得到

这就是局部相依性测度。Jones（1996）证明，可把式（4-4）视为局部协方差的测度。为了理清这一点，考虑

其中，ω u,v 是（u,v）的一个局部性加权函数。确定局部相关系数的自然方式是进行如下定义

当Ex=Ey=0，并且ω u,v （·,·）≡1时，获得的结果是普通的相关系数。一个局部加权函数定义为

其中，h 1 和h 2 是带宽，内核K是密度。把式（4-6）代入到式（4-5）中，并令h 1 ，h 2 →0，则得到基本的泰勒展开式，有

这就是由Holland和Wang（1987a）给出的式（4-4）局部相依性函数。

对于非退化的二元正态分布 083-02 ，即有

可以很容易地得出

因此，对于两元正态分布而言，δ x,y 是依赖于ρ的常数，且δ x,y 与ρ之间呈现非线性。

Jones（1996）、Jones（1998）以及Jones和Koch（2003）［还可参阅Hufthammer（2009）的相关讨论］给出了局部相依性函数的许多性质和例子。除了其他方面，当且仅当x和y相互独立时，对于所有的（u,v），δ x,y （u,v）=0均成立。与相关系数曲线相比，在局部相关系数函数中，把变量x和y是等同对待的。容易看出，局部相关系数函数只是给定y时的x的条件分布的函数，或者给定x时的y的条件分布的函数。因此，δ是一种无关边缘的相依性的测度方法。另外，存在以下的密度描述（Jones，1998），其局部相依性函数为常数，等于c，密度描述式为

f x,y （u,v）=a（u, θ ）b（v, ψ ）exp（cuv）

其中，a（u, θ ）和b（v, ψ ）只是与f相联系的任意函数，所以f是密度， θ , ψ 和c是未知参数。局部相关系数函数可以用kernel函数方法估计，可参阅第13.1节的讨论，Jones和Koch（2003）以及Hufthammer（2009）也给出了一些例子。

最近，Hufthammer和Tjøstheim（2010）提出了一种新的定义局部相关系数的方法，该局部相关系数在-1到+1之间变化。这种方法的思想是，在f x,y 的每一点（u,v），用局部似然法拟合局部二元高斯近似。把高斯分布的相关系数ρ x,y （u,v）可以作为（u,v）点处的局部相关系数。对于多元高斯分布，借助这种方法，不但可以获得全局的相依性，而且也可以得到局部相依性。Hufthammer和Tjøstheim（2010）提出了渐近理论，并列举了很多例子。Stove、Hufthammer和Tjøstheim（2010）将其运用到了金融传染的研究中。

4.4.2　相依性的全局测度

目前为止，对于所考察的全局相依性测度，也就是相关系数函数，主要存在两个问题：①这个相关系数函数不总是能够捕获到非线性过程的相依性；②对于非高斯分布，这个相关系数函数不能达到全范围［-1,1］，关于这一点，在前面已经提及过。对于第二个问题，采用Spearman和Kendall秩相关系数就可以避免。可把Spearman秩相关系数ρ s 定义为F x （x）和F y （y）之间的普通相关系数，其中，F x 和F y 分别是随机变量x和y的累积分布函数。如果x和y是连续变量，那么，F x （x）和F y （y）为均匀分布，且

ρ s;x,y =corr（F x （x）,F y （y））=12E（F x （x）,F y （y））-3

（4-7）

通过用秩代替每一观察值，然后计算秩的常规样本相关性系数，就可以计算出Spearman样本秩相关系数。秩相关系数是一种单调相关的测度，而且对原数据增加的所有转换，秩相关系数都将保持不变。不同于普通相关系数，极端观测值对秩相关系数的影响并不大，这是一种十分稳健的相关性测度方法。此外，由于基于秩，ρ s 将覆盖全范围-1到+1。第7.7.2节将对时间序列中ρ s 的性质做进一步的介绍。

Kendall的τ是基于一致性的概念。如果（u 1 -u 2 ）（v 1 -v 2 ）>0，则随机变量对（x,y）的两对观测值（u 1 ,v 1 ）和（u 2 ,v 2 ）是一致的；否则是不一致的。现在，定义Q=（x 1 -x 2 ）（y 1 -y 2 ），在这里，（x 1 ,y 1 ）和（x 2 ,y 2 ）是（x,y）分布中两个相互独立的样本。Kendall的τ是一致性的一种测度方法，把它定义为观测值是一致的概率与不一致的概率之差，其定义表述为

τ=Pr（Q>0）-Pr（Q<0）=2Pr（Q>0）-1

（4-8）

当变量连续时，则式（4-8）的最后一个等式是有效的。得到的τ的估计量为

其中，n c 是观测值中一致对的数量， 084-02 是观测值中不一致对的数量。很显然，τ在［-1,1］的全范围。

不同于ρ，Spearman的相关性系数ρ s 也可以作为一致性的测度。Nelsen（1999）有更详细的介绍。τ和ρ s 之间的一个重要关系是-1≤3τ-2ρ s ≤1。当x和y是相关的随机变量时，τ和ρ s 都可以为0，所以，普通相关系数函数的不足是不可避免的。

4.4.3　基于密度和分布函数的测度

当且仅当对于所有的u和v，F x,y （u,v）=F x （u）F y （v）成立时，随机变量x和y是相互独立的，其中，F x,y 和F x 、F y 分别是x和y的联合分布和边缘分布。同样地，如果密度函数存在，x和y是相互独立的，当且仅当对于所有的（u,v），f x,y （u,v）=f x （u）f y （v）成立。因此，显而易见，诊断相依性偏差的方式是建立函数，以测度联合分布和边缘分布乘积的距离。例如，式

d（F 1 ,F 2 ）=∫{F 1 （u,v）-F 2 （u,v）} 2 dF 1 （u,v）

是累积分布函数F 1 =F x,y 和F 2 =F x F y 之间的距离测度。用同样的方式，距离函数d（f 1 , f 2 ）也可以在密度函数f 1 =f x,y 和f 2 =f x f y 之间进行定义。Hellinger距离

可以作为一个例子。其他的密度距离函数在第7.7节可以找到。这些距离测度遵循d（F 1 , F 2 ）≥0和d（f 1 , f 2 ）≥0的条件，因此，这种方法不能测度独立性偏差（正或负）的方向，距离测度不能用于一致性与否的测度。在对独立性检验的这些距离测度的应用上，上面提及的情况并不是至关重要的。y t 和y t-s 之间的独立性检验是可行的，且基于估计模型残差的误差检验也是可行的。这些度量方法通常能够轻易地用于测度ARCH类型的相依性，而普通相关系数函数却对此无能为力。第7.7节将会有更多的细节介绍。

对于具有非线性相互依存结构的{x t }和{y t }两个时间序列，可以用相依性测度以发现它们之间最优的比对。为了达到这个目标，需要最大化作为滞后阶数s函数的相依性准则，就如在线性情况中对一般互相关函数的检验。这个方向的尝试有Auestad、Shumway、Tjøstheim和Verosub（2008）对所谓的纹泥数据的校准。

Bergsma（2008）给出了对相依性的全局相关系数类测度进行定义的另一种尝试。他的相关系数函数与普通相关系数ρ的平方ρ 2 有关。Huang（2010）以最大化相关系数为基础，构建了一种条件相依性的测度方法，Su和White（2007，2008）用类似于第7.7.7节讲述的测度方法检验了条件独立性。

4.4.4　Copula函数

联合分布F x,y 决定了边缘分布F x 和F y ，反之则不是。寻找与边缘分布有着紧密联系的测度d颇有意思，而这里的边缘分布唯一的确定x和y的联合分布，使得F x,y （u,v）=d（F x ,F y ;u,v）。这一测度方法就是copula函数，并已经成为一般领域和金融计量经济领域中的研究兴趣所在。本书参考了Joe（1997）、Nelsen（1999）、Cherubini、Luciano和Vecchiato（2004）以及Patton（2009）的相关观点，后面两篇文献直接把copula函数运用到了金融领域，在这两篇文献当中也还有很多参考文献。

对于均匀分布变量，在本质上，Copula是联合累积分布函数。对于m个变量x 1 ,…,x m 的向量 x ，其中，m个变量都定义在I=［0,1］上，CopulaC x （ u ）定义如下，其中 u =（u 1 ,…,u m ）。

C x （ u ）=0，如果至少有一个u i =0

C x （ u ）=u i ，i=1,…,m，如果u j =1，对所有的j≠i

此外，对单位超立方体I m 内所有的 a 和 b ，使a i ≤b i ，i=1,…,m，根据C，［ a , b ］的测度值是非负的。Copula的重要性由Sklar定理（Sklar 1959）推断而出：如果F是具有边缘分布F 1 ,…,F m 的联合分布函数，则存在一个m-copula函数C，使得

F（u 1 ,…,u m ）=C{F 1 （u 1 ）,…,F m （u m ）}

（4-9）

如果F 1 ,…,F m 是连续的，则m-copula函数C是唯一的。另外，m-copula函数C在F 1 ,…,F m 的范围上被唯一的定义。如果随机变量x 1 ,…,x m 是连续的，由式（4-9）可以直接推导出下面的函数形式

如果它们不是连续的，逆函数不得不被由F - （u i ）={infv i :F（v i ）≥u i }定义的广义逆所取代。

相反，如果C是一个给定的Copula，而且F 1 ,…,F m 是分布函数，则由式（4-9）所定义的函数F是具有边缘分布F 1 ,…,F m 的联合分布函数。存在Copulas的目录清单（Joe，1997；Nelsen，1999），通过在目录清单中选择Copulas，就可以从给定的边缘分布集合中构建具有特定性质的联合分布。

可以看出，连同边缘分布的Copula能完全表现出多元分布的特征。此外，对原始变量增加任何转换，都是不变的。Copula能捕获对从边缘到联合分布的必要额外信息。因此，对一系列随机变量的任何相依性测度均应取决于这些变量的Copula的观点可能有争议。这是经常出现的情况，例如，对于第4.4.2节所介绍的Spearman秩相关系数而言，如下的式子是微不足道的。

ρ s =12E{F x （x）F y （y）}-3=12∫C x,y （u,v）dudv-3

对于Kendall的τ而言，需要更多的工作以发现基于Copula的表达式

τ=4∫C x,y （u,v）dC x,y （u,v）-1

第7.7节中讨论到相依性测度的定义时，将对Copula进行简要回顾。Copulas被广泛地运用在风险管理中（Cherubini等，2004），但是在这种关联中，它通常假定观测值，即资产收益率，是由iid随机变量生成的。然而，众所周知，收益率序列包含更高阶的相依性。在最新的Copula在时间序列的应用中，已经对此加以考虑，相应的Copula也变为条件Copula。Patton（2009）回顾了在这个方面正在发展的学术前沿的文献。建立一个令人满意的时间序列理论是非常困难的。Mikosch（2006）关注到这个事实，并且对关于Copula在时间序列分析中的运用，提出了很多批判性意见。第8章将会讲述金融序列中用于描述高阶相依性的模型。

4.4 非线性过程的相依性测度

4.4.1 相依性的局部测度

4.4.2 相依性的全局测度

4.4.3 基于密度和分布函数的测度

4.4.4 Copula函数

4.4　非线性过程的相依性测度

4.4.1　相依性的局部测度

4.4.2　相依性的全局测度

4.4.3　基于密度和分布函数的测度

4.4.4　Copula函数