本书讲述的是统计套利的故事。它既描述了统计套利的历史,追溯始于20世纪80年代统计套利策略在摩根士丹利诞生,到面临重重考验的21世纪初的过往岁月,同时也阐释了统计套利的运作方式和存在的原因。这些介绍来源于一些基本的原理,并在最大程度上采用一个基本的分析框架。当阐述技术原理时,我们努力抵制各种诱惑,希望为广大感兴趣的读者,呈现一个易于理解、容易接受的成果。我只能是“尽可能”,因为第7章和第11章的附录属于“未能抵制诱惑”。对于许多顶尖专业人员构建的大多数模型,本书只是对其概念进行了论述,而且举例也仅仅局限于读者所熟悉的模型上。作为统计套利的起源,匹配交易(pair trade)这一术语在本书中更多地是被作为一个有教育意义的例子,而不是承认它在实际交易中发挥的作用。正因为采用的是这种方式,所以读者有可能忽视了本书作为一部匹配交易手册的作用,虽然读者阅读这部作品时自身具有的经验、阅读的目的以及对本书的期待具有广泛性,但发生上述情况也是不可避免的。在实际交易中,简单且缺乏精心设计的匹配交易不再有利可图,但是,匹配交易在解释说明性方面依然是有价值的工具,因为它在避免将问题变得复杂的前提下,保留了阐明观点、构建模型和分析问题的能力。在市场历经了25年的发展之后,读者要构建一个超越本书理解和说明范围之外的有利可图的交易策略,需要在结构的复杂性和分析的精巧性上多做文章。
本书采用的精巧设计方案是构造了一组相似的匹配交易,这些交易通常被指定为一个群体,但是,对于如何运用矩阵来测量其相似程度的细节,并没有过多地探究。构建这样的股票组合模型可以采取几种方法。一些人更愿意将所构建的股票组合定位在通用模型上,然后观察实际匹配交易与通用模型的偏差,进而调整预期;另外一些人则喜欢采用正式的数学公式,将其作为一种合成工具。近20年来,这两种方式以及其他一些方式都可以被作为评级模型进行正式的分析,这在主流统计学思想领域非常盛行,而且在见解和应用方面都卓有成效。将时间序列中的动态因素加入到标准静态结构中,能非常便捷地构造一个精巧的分析结构,其复杂程度可能超过本书经常提起的工具。尽管如此,所有这类模型的发展都依赖本书所详细阐述的观点和技巧。
具有高等数学和统计学知识的读者,能迅速找到应用知识的场合。
本书的重点内容集中在结构简单的匹配交易上,希望读者将本书看做是一本手册,能清晰地找到“如何做”的方法。从这个角度来讲,读者从本书中能了解到统计套利发展的历史,包括“什么是统计套利,它是如何运作的以及为什么它具有合理性”。同时,也正如我们前面所提到的那样,要成功地执行交易还要求读者进行更多的思考和应用性研究。要完成这一任务,你可以将本书当做一张地图,它揭示了统计套利的主要特性,并且暗示读者在哪里需要使用指南针和笔记本。当你进行此类冒险时,要记住地图绘制人员标注的“危险”这样的标记,因为这对你可能会非常有用。
本文坦然地把统计学家的观点(即模型具备有效性)当做是正确的。坚持模型的有效性是本书的主题之一。统计学家对变量的理解,即认可这样的看法:尽管有用,但其模型是错误的,而且这种错误的性质是通过结构性“误差”(观测值和模型预测值之间的差异)来阐明的,这也是本书的另外一个主题。可以说,这不仅仅是一个简单的主题,更是统领全书、具有导向性的核心思想。
第1章介绍了匹配交易的概念,第2章对匹配交易进行详细说明。通过解释说明和举例,针对匹配交易和反转现象,我们提出两个简单的理论模型。这些模型将贯彻全文,被用来研究可能性是什么,说明怎么利用这些可能性,考虑什么样的变化会导致负面影响,并描绘这种影响的特性。本书同时描述了如何选择一系列金融工具进行建模和交易的方法。在开始分析的时候,就需要考虑“变化”这个因素,因为动态时间变化会对整体投资方案起到强化作用。没有动态变化,就不存在套利。
在第3章中,增加了分析的深度和广度,将建模的范围从简单的观测性的匹配规则
,扩展到正式的统计模型,适用于更具普遍意义的投资组合。本书描述了几个流行的时间序列模型,但讨论的重点集中在两个模型上,一种是极端复杂的加权移动平均模型,另外一种是因素分析模型,尽可能将这两种极端情况下的模型所具备的信息论述清楚。正如前面已经提到的,匹配价差模型将贯穿全书,作为最简单的实际应用案例用于概念讨论。在有必要特别强调的地方,我们会直接提出套利者所关心的各方面的问题,包括投资组合的优化方法和风险因子的暴露程度。但是,在大多数情况下,本书尽量避免涉猎多个领域的知识。波动率模型(以及极富吸引力的随机共振模型)将在第3章和第6章中专门予以讨论,在本书的其他章节将纳入到均值预测过程的探讨中。
第4章提出概率定理,这是一种描述股票价格运动的流行方法,这种方法在20世纪80年代晚期首次应用到简单规则之后,就经常被拿来使用。了解这种结果可以指导模型开发策略中的价值评估工作。因为这一结果受结构性的动态变化驱动,通过长期在公共领域认真观察就可予以揭示,是否需要建模人员的智慧结晶,或者只是像高中毕业生会做的那样,只是简单执行就可以了?许多统计套利从业人员声称将会获得高比例收益的模型。他们所建立的模型与基本价差模型或(重要的)风险管理模型比起来都显得过于简单,需要在精巧性上花更多的功夫。当市场崩盘并且违背理论成立的假设条件时,比较统计套利从业人员的实际绩效,我们可以发现他们对统计套利的基本知识的理解,存在着显著的差异。当事情一切顺利时,无论是具有理论知识的管理者还是盲目操作的人,所能获得的回报都是相同的,但当理论成立的假设条件不成立时,理论知识通常能揭示更多的信息(托尼·欧·哈根认为概率定理的基本结论是众所周知的,但我已无法验证这种说法的正确性。这个结论是如此微不足道,以至于没有一个正式的名称,它仅仅作为一个简单的结论,或者作为练习题出现在概率分布的教材中。无论如何,对于统计套利来说,这个结论具有非常深远的意义)。
第5章针对一篇已出版的文章展开评论,以验证反转现象发生的非限制性条件(文中我们不提作者的名字,以避免引起尴尬)。文章忽略了正态分布的核心作用,提出两个孪生的错误主张:①股票价格序列一定要显示出正态边际分布的特征,才可能发生反转现象;②一个正态边际分布的序列,必然会发生反转的现象。对于这两种观点,给予了驳斥。如同第4章所阐述的一样,反转现象无处不在。
第6章对“在一个价差组合中,波动率究竟是多少”这个问题予以了解答,因为在进行反转交易时,它直接关系到量化可利用的机会。
第7章讲述的是存在诸多象形文字的概率微积分,非常适合热衷该内容的爱好者。只要是曾经认真上过概率理论课程的人,都应该能够理解该章所提到的观点,并且大多数人也应该都能看懂其中的推论。概率微积分的机理并非十分复杂。刚开始的时候,我们对一些概念进行了区分,对读者来说可能具有一定的挑战性——建议多读两遍!案例中蕴含着重要而富有实际意义的见解,努力领悟一定会获得回报。至于理论上的抽象概念是如何反映在实际价格序列的测量特性上,这一知识对于评价建模的可能性、模型仿真或者交易结果来说都是非常珍贵的。不过,尽管第7章非常重要,但要提醒读者的是,阅读本书其他部分不需要本章的知识。尽管你可能会漏掉随后讨论中一些更精巧的观点,但并不会因为没有理解第7章的内容而看不懂其他部分的论述。
从第8章到第10章,我们或许可以给其贴上“衰落”的标签,因为这几章所讨论的内容具有共同的特性,即描述了从2000年开始统计套利遇到问题,并且直接引起了2002~2004年收益的灾难性下降。我们从历史中吸取的深刻教训是,在2000年的时候,并没有某个单一的条件或者是某几个条件组合发生剧烈的变化,使统计套利模型没能达到预期的绩效。那么究竟是怎么回事呢?它比现实更具有戏剧性,可以说是诸多复杂的原因和时机相互融合之后产生的结果。许多为人所熟悉的观点,包括报价单位采用十进制、竞争、低波动率等因素都试图解释这一切。每个说法都有一定的影响力,但是其中任何一个单独拿出来,或者甚至是将这些因素综合起来,都无法影响金融市场。市场的价格动态变化确实发生了根本性的改变,不管是频繁发生的每日交易,还是超过一个月以上的投资都受到了影响,这大大地削弱了反转机制的经济价值,对于这种情况,我们需要进行更深入的研究。
一个变化接着一个变化就是第9章的主要内容,也是2002~2004年统计套利无法获得收益的根本原因(在2000~2002年期间,业绩恶化非常明显,但仅限于行业内一部分从业人员。但是到了2002~2004年,统计套利策略普遍无法获取收益)。直到最近,美国宏观经济历史中很不寻常的插曲终于结束了,但是它所造成的后果仍然影响着美国金融市场,数以百万计的投资者的集体行为是随机的;当然,不管以何种方式存在于市场,投资者继续在体验着那些变化,以及引起变化的原因。
交易方式发生了转变,从纽约证券交易所热闹的大厅,逐渐变成无声的电子交易,通过大型经纪商及投资银行设计的计算机算法,慢慢积聚力量,最终变成类似冰河时期一样无法平息的巨变。这些变化缓慢、巨大、不能抗拒,颇具毁灭性,同时也带有推陈出新的特性
。在动态变化中,市场波动率的下降频繁地被拿来讨论。市场波动率到哪里去了?可以说,有很大一部分是被算法给“吞噬”了。个体参与者的声音被弱化了,不过,混乱的场面事实上并没有受到影响。有相当多的市场参与者和混乱的场面,以另外一种方式继续存在着。就目前的情况而言,计算机程序(见第10章)“管理”着超过60%的美国股权交易,其所产生出来的效果,就有点像是在给市场这个多动症患儿打了一剂“利他林”(ritalin)。有两种关于低波动率的论述:其一是,悲观地认为市场缺乏凯恩斯所说的动物性本能,主要的说法是,当亚洲正在复兴时,美国的创业激情却受到了限制;其二是,投资者忘记了投资决策的风险,以及与此相伴而生的恐惧,低估了波动率,做出错误的决策,在将来产生负面影响。这两种说法不一致,但这种矛盾可以被化解。与第一种说法相对立的观点是,那种动物性本能依然很活跃,每天约有15亿股的股票在纽约证券交易所进行交易。对此,我们还能得出其他的结论吗?或许应该说,这种动物性的本能仍广泛存在。算法是没有情感的。因此,出现了大量创新性的风险承担方式,按照历史标准进行比较,其波动率相对偏低,这是由交易技术引起的,但尚未被许多市场参与者认识到。如果以历史数据来检验现有的波动率水平,不可避免地高估了风险。
暂不考虑统计套利机会的进化与第10章之间存在什么关系,就第10章本身而言还是很有趣的。算法和计算机驱动的交易正以多种多样的方式改变着金融世界。世界上绝大多数人都已经选择电子交易方式进行交易——谁知道再过几年,纽约证券交易所的大厅会不会变成博物馆、停车场,或者只是出现在我们的记忆中呢?
第11章描述了由于算法交易的技术进步,导致统计套利浴火重生,重新创造一个新的局面。新型的股价动态模式已经浮出水面。统计套利的故事又回到了新的起点,这只雏鸟能否顺利地飞翔呢?
在第11章中,预测统计套利的复兴,出现在2005年,如今预测已经在逐渐变成现实。至少从2006年早期开始,那些经历了2003~2005年富有挑战性的动态变化过程的从业人员,已经看到了其业绩表现。有趣的是,虽然在普通股票的价格运动中,存在新的系统性模式,但旧的模式似乎也已经恢复了活力。人们正在加速使用算法交易,目前有20家以上的公司能够提供相应的工具软件。在技术进步的发展过程中,从2006年下半年开始,至少有两只以算法为基础的对冲基金出现在市场中。对于统计套利从业人员而言,这是一个令人兴奋且恰逢其时的好时机!