购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

4.4 非线性过程的相依性测度

在前面讲解的内容中已经提到,自相关函数不能对非线性时间序列的相依性结构做出充分的描述。条件数量,比如条件均值和条件方差,只是描述了从过去到现在的转换,但是并没有真正地通过扩展自相关函数而建立起测度相依性的方法。当然,(y t , y s )的联合分布可以描述y t 和y s 之间的相依性关系,但是相依性的强度和方向并不能轻易地从这个函数中推导出来。本节将简要回顾为建立非线性相依性的测度方法所做的不懈工作。这些工作不仅仅限于时间序列方面,但是要把考虑的情形限制在二元变量中,即考虑测度两个随机变量x和y的相依性的问题。

在本节,不得不区分局部和全局的相依性测度。全局相依性测度是用单一的数值说明x和y之间的相依性或依存程度,而局部相依性测度是用实际指标为u和v表征x和y的函数。比如,x和y的大值可能会导致更强的正相依,也就是说,x和y的小值可能仅暗示着弱相依性。显然,自相关函数是相依性的全局测度。

4.4.1 相依性的局部测度

Bjerve和Doksum(1994)所提出的相关曲线是局部测度的例子。同时,也可参阅Blyrh(1994)以及Doksum、Blyth、Bradlow、Meng和Zhao(1994)的文章。他们通过指出这样一个事实:两种金融资产x和y之间的相关性有可能应该取决于x和y如何取值,提出了这种测度方法。对于x和y之间的线性回归关系

y t =α+βx t t

x和y的相关系数ρ x,y

081-01

其中,σ x 、σ y 和σ ε 分别是x、y和ε的标准差。Bjerve和Doksum(1993)在x=u的条件下,基于局部化ρ提出一个一般化的表征局部相依程度的测度指标,叫相关系数曲线,表达式为

081-02

其中, 081-03081-04 ,并假定条件均值函数m(u)=E{y|x=u}是可微的。他们同样提到,可用位置和规模的其他合适的测度方法替代m(u)和 082-01 。相关系数曲线可以用内核估计方法直接估计,在第13章将对此有所讨论,对于相关的性质和例子可参阅Bjerve和Doksum(1993)的讨论。相关系数曲线的缺点之一为非对称,也就是说,一般情况下ρ x,y (·)≠ρ y,x (·)。对此,作者提出了一个对称的相关系数曲线,但非常特殊。

由Holland和Wang(1987a)提出的局部相依性函数,在Holland和Wang(1987b)中也有所提及,对于x和y是非对称的。把两个随机变量x和y作为起点,它们的局部交叉乘积比率为

082-02

其中,P ij =Pr(x=u i ,y=v j )。结合x和y的边缘分布,系数α ij 唯一决定x和y的联合分布。Goodman(1969)的研究有例子说明,并且其中的参考文献对此有详细介绍。令f x,y 为两个连续变量x和y的联合密度,进一步,让R u,v 表示包含点(u,v)的矩形,且具有长度为Δu和Δv的边,则有

P u,v =Pr{(x,y)∈R u,v }≈f x,y (u,v)ΔuΔv

(4-3)

令θ ij =lnα ij ,并且把代表矩形网络的式(4-3)代入到乘积比率的式(4-2)中,当Δu,Δv→0时,可以得到

082-03

这就是局部相依性测度。Jones(1996)证明,可把式(4-4)视为局部协方差的测度。为了理清这一点,考虑

082-04

其中,ω u,v 是(u,v)的一个局部性加权函数。确定局部相关系数的自然方式是进行如下定义

082-05

当Ex=Ey=0,并且ω u,v (·,·)≡1时,获得的结果是普通的相关系数。一个局部加权函数定义为

082-06

其中,h 1 和h 2 是带宽,内核K是密度。把式(4-6)代入到式(4-5)中,并令h 1 ,h 2 →0,则得到基本的泰勒展开式,有

083-01

这就是由Holland和Wang(1987a)给出的式(4-4)局部相依性函数。

对于非退化的二元正态分布 083-02 ,即有

083-03

可以很容易地得出

083-04

因此,对于两元正态分布而言,δ x,y 是依赖于ρ的常数,且δ x,y 与ρ之间呈现非线性。

Jones(1996)、Jones(1998)以及Jones和Koch(2003)[还可参阅Hufthammer(2009)的相关讨论]给出了局部相依性函数的许多性质和例子。除了其他方面,当且仅当x和y相互独立时,对于所有的(u,v),δ x,y (u,v)=0均成立。与相关系数曲线相比,在局部相关系数函数中,把变量x和y是等同对待的。容易看出,局部相关系数函数只是给定y时的x的条件分布的函数,或者给定x时的y的条件分布的函数。因此,δ是一种无关边缘的相依性的测度方法。另外,存在以下的密度描述(Jones,1998),其局部相依性函数为常数,等于c,密度描述式为

f x,y (u,v)=a(u, θ )b(v, ψ )exp(cuv)

其中,a(u, θ )和b(v, ψ )只是与f相联系的任意函数,所以f是密度, θ , ψ 和c是未知参数。局部相关系数函数可以用kernel函数方法估计,可参阅第13.1节的讨论,Jones和Koch(2003)以及Hufthammer(2009)也给出了一些例子。

最近,Hufthammer和Tjøstheim(2010)提出了一种新的定义局部相关系数的方法,该局部相关系数在-1到+1之间变化。这种方法的思想是,在f x,y 的每一点(u,v),用局部似然法拟合局部二元高斯近似。把高斯分布的相关系数ρ x,y (u,v)可以作为(u,v)点处的局部相关系数。对于多元高斯分布,借助这种方法,不但可以获得全局的相依性,而且也可以得到局部相依性。Hufthammer和Tjøstheim(2010)提出了渐近理论,并列举了很多例子。Stove、Hufthammer和Tjøstheim(2010)将其运用到了金融传染的研究中。

4.4.2 相依性的全局测度

目前为止,对于所考察的全局相依性测度,也就是相关系数函数,主要存在两个问题:①这个相关系数函数不总是能够捕获到非线性过程的相依性;②对于非高斯分布,这个相关系数函数不能达到全范围[-1,1],关于这一点,在前面已经提及过。对于第二个问题,采用Spearman和Kendall秩相关系数就可以避免。可把Spearman秩相关系数ρ s 定义为F x (x)和F y (y)之间的普通相关系数,其中,F x 和F y 分别是随机变量x和y的累积分布函数。如果x和y是连续变量,那么,F x (x)和F y (y)为均匀分布,且

ρ s;x,y =corr(F x (x),F y (y))=12E(F x (x),F y (y))-3

(4-7)

通过用秩代替每一观察值,然后计算秩的常规样本相关性系数,就可以计算出Spearman样本秩相关系数。秩相关系数是一种单调相关的测度,而且对原数据增加的所有转换,秩相关系数都将保持不变。不同于普通相关系数,极端观测值对秩相关系数的影响并不大,这是一种十分稳健的相关性测度方法。此外,由于基于秩,ρ s 将覆盖全范围-1到+1。第7.7.2节将对时间序列中ρ s 的性质做进一步的介绍。

Kendall的τ是基于一致性的概念。如果(u 1 -u 2 )(v 1 -v 2 )>0,则随机变量对(x,y)的两对观测值(u 1 ,v 1 )和(u 2 ,v 2 )是一致的;否则是不一致的。现在,定义Q=(x 1 -x 2 )(y 1 -y 2 ),在这里,(x 1 ,y 1 )和(x 2 ,y 2 )是(x,y)分布中两个相互独立的样本。Kendall的τ是一致性的一种测度方法,把它定义为观测值是一致的概率与不一致的概率之差,其定义表述为

τ=Pr(Q>0)-Pr(Q<0)=2Pr(Q>0)-1

(4-8)

当变量连续时,则式(4-8)的最后一个等式是有效的。得到的τ的估计量为

084-01

其中,n c 是观测值中一致对的数量, 084-02 是观测值中不一致对的数量。很显然,τ在[-1,1]的全范围。

不同于ρ,Spearman的相关性系数ρ s 也可以作为一致性的测度。Nelsen(1999)有更详细的介绍。τ和ρ s 之间的一个重要关系是-1≤3τ-2ρ s ≤1。当x和y是相关的随机变量时,τ和ρ s 都可以为0,所以,普通相关系数函数的不足是不可避免的。

4.4.3 基于密度和分布函数的测度

当且仅当对于所有的u和v,F x,y (u,v)=F x (u)F y (v)成立时,随机变量x和y是相互独立的,其中,F x,y 和F x 、F y 分别是x和y的联合分布和边缘分布。同样地,如果密度函数存在,x和y是相互独立的,当且仅当对于所有的(u,v),f x,y (u,v)=f x (u)f y (v)成立。因此,显而易见,诊断相依性偏差的方式是建立函数,以测度联合分布和边缘分布乘积的距离。例如,式

d(F 1 ,F 2 )=∫{F 1 (u,v)-F 2 (u,v)} 2 dF 1 (u,v)

是累积分布函数F 1 =F x,y 和F 2 =F x F y 之间的距离测度。用同样的方式,距离函数d(f 1 , f 2 )也可以在密度函数f 1 =f x,y 和f 2 =f x f y 之间进行定义。Hellinger距离

085-01

可以作为一个例子。其他的密度距离函数在第7.7节可以找到。这些距离测度遵循d(F 1 , F 2 )≥0和d(f 1 , f 2 )≥0的条件,因此,这种方法不能测度独立性偏差(正或负)的方向,距离测度不能用于一致性与否的测度。在对独立性检验的这些距离测度的应用上,上面提及的情况并不是至关重要的。y t 和y t-s 之间的独立性检验是可行的,且基于估计模型残差的误差检验也是可行的。这些度量方法通常能够轻易地用于测度ARCH类型的相依性,而普通相关系数函数却对此无能为力。第7.7节将会有更多的细节介绍。

对于具有非线性相互依存结构的{x t }和{y t }两个时间序列,可以用相依性测度以发现它们之间最优的比对。为了达到这个目标,需要最大化作为滞后阶数s函数的相依性准则,就如在线性情况中对一般互相关函数的检验。这个方向的尝试有Auestad、Shumway、Tjøstheim和Verosub(2008)对所谓的纹泥数据的校准。

Bergsma(2008)给出了对相依性的全局相关系数类测度进行定义的另一种尝试。他的相关系数函数与普通相关系数ρ的平方ρ 2 有关。Huang(2010)以最大化相关系数为基础,构建了一种条件相依性的测度方法,Su和White(2007,2008)用类似于第7.7.7节讲述的测度方法检验了条件独立性。

4.4.4 Copula函数

联合分布F x,y 决定了边缘分布F x 和F y ,反之则不是。寻找与边缘分布有着紧密联系的测度d颇有意思,而这里的边缘分布唯一的确定x和y的联合分布,使得F x,y (u,v)=d(F x ,F y ;u,v)。这一测度方法就是copula函数,并已经成为一般领域和金融计量经济领域中的研究兴趣所在。本书参考了Joe(1997)、Nelsen(1999)、Cherubini、Luciano和Vecchiato(2004)以及Patton(2009)的相关观点,后面两篇文献直接把copula函数运用到了金融领域,在这两篇文献当中也还有很多参考文献。

对于均匀分布变量,在本质上,Copula是联合累积分布函数。对于m个变量x 1 ,…,x m 的向量 x ,其中,m个变量都定义在I=[0,1]上,CopulaC x u )定义如下,其中 u =(u 1 ,…,u m )。

C x u )=0,如果至少有一个u i =0

C x u )=u i ,i=1,…,m,如果u j =1,对所有的j≠i

此外,对单位超立方体I m 内所有的 a b ,使a i ≤b i ,i=1,…,m,根据C,[ a , b ]的测度值是非负的。Copula的重要性由Sklar定理(Sklar 1959)推断而出:如果F是具有边缘分布F 1 ,…,F m 的联合分布函数,则存在一个m-copula函数C,使得

F(u 1 ,…,u m )=C{F 1 (u 1 ),…,F m (u m )}

(4-9)

如果F 1 ,…,F m 是连续的,则m-copula函数C是唯一的。另外,m-copula函数C在F 1 ,…,F m 的范围上被唯一的定义。如果随机变量x 1 ,…,x m 是连续的,由式(4-9)可以直接推导出下面的函数形式

086-01

如果它们不是连续的,逆函数不得不被由F - (u i )={infv i :F(v i )≥u i }定义的广义逆所取代。

相反,如果C是一个给定的Copula,而且F 1 ,…,F m 是分布函数,则由式(4-9)所定义的函数F是具有边缘分布F 1 ,…,F m 的联合分布函数。存在Copulas的目录清单(Joe,1997;Nelsen,1999),通过在目录清单中选择Copulas,就可以从给定的边缘分布集合中构建具有特定性质的联合分布。

可以看出,连同边缘分布的Copula能完全表现出多元分布的特征。此外,对原始变量增加任何转换,都是不变的。Copula能捕获对从边缘到联合分布的必要额外信息。因此,对一系列随机变量的任何相依性测度均应取决于这些变量的Copula的观点可能有争议。这是经常出现的情况,例如,对于第4.4.2节所介绍的Spearman秩相关系数而言,如下的式子是微不足道的。

ρ s =12E{F x (x)F y (y)}-3=12∫C x,y (u,v)dudv-3

对于Kendall的τ而言,需要更多的工作以发现基于Copula的表达式

τ=4∫C x,y (u,v)dC x,y (u,v)-1

第7.7节中讨论到相依性测度的定义时,将对Copula进行简要回顾。Copulas被广泛地运用在风险管理中(Cherubini等,2004),但是在这种关联中,它通常假定观测值,即资产收益率,是由iid随机变量生成的。然而,众所周知,收益率序列包含更高阶的相依性。在最新的Copula在时间序列的应用中,已经对此加以考虑,相应的Copula也变为条件Copula。Patton(2009)回顾了在这个方面正在发展的学术前沿的文献。建立一个令人满意的时间序列理论是非常困难的。Mikosch(2006)关注到这个事实,并且对关于Copula在时间序列分析中的运用,提出了很多批判性意见。第8章将会讲述金融序列中用于描述高阶相依性的模型。 C6be/uJNfcN33iKfAtGzyHPx9lyBJzDQNh/x0bMP6l9/uBuzFtqggLH91N1NlZyf

点击中间区域
呼出菜单
上一章
目录
下一章
×