购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

对许多人来说,政治预测就是“麦克劳夫伦讨论小组”这档电视节目的同义词。从1982年开始,每周日电视台都会播出这样一场“政治圆桌会议”,之后还会被“周六夜现场”节目恶搞一番。节目主持人约翰·麦克劳夫伦是一个80多岁的暴脾气老人,曾在1970年竞选美国参议员时落败。该节目像组织体育活动一样组织政治专家展开讨论,小组成员要在半个小时内循环讨论四五个话题,麦克劳夫伦会就相关话题对这些成员步步紧逼,这些话题从澳大利亚政治探讨到地外智慧生物探寻,无所不包。

“麦克劳夫伦讨论小组”每期节目的最后都设有一个“预测”的环节,在这个环节中,小组成员用几秒钟的时间讨论当天发生的某件事的重要性。有时,他们可以选择一个和政治关系不大的话题进行预测;有时,麦克劳夫伦会就某一个特定问题突击询问小组成员,让他们现场作答,麦克劳夫伦称此为“强迫性预测”。

麦克劳夫伦的有些问题很难回答,比如让小组成员从几个最佳候选人中选出最高法院的下届法官。其他问题则比较温和,比如2008年美国总统大选前夕,他曾让小组成员预测麦凯恩和奥巴马谁会当选。

答案显而易见。2008年9月15日,雷曼兄弟宣布破产,引发了自20世纪30年代大萧条时期之后最严重的经济衰退,正是从那天起,奥巴马的选票数几乎在所有的美国投票站都领先麦凯恩。而且,不论是在俄亥俄州、佛罗里达州、宾夕法尼亚州或是新罕布什尔州这样的“摇摆”州,还是在一些民主党很少获胜的地区,如科罗拉多州和弗吉尼亚州,奥巴马也都处于领先地位。我为自己的网站开发的预测模式和其他类似的统计模式都表明,奥巴马赢得大选的可能性超过95%,赌博市场虽然对美国总统大选结果的估计稍显模棱两可,但对奥巴马获选的支持率预测也达到了7∶1。

而“麦克劳夫伦讨论小组”的首席成员帕特·布坎南对这个问题却避而不谈。他说:“一切自有定数,本周末自然见分晓”,这句话引得其他成员一阵爆笑。来自《芝加哥论坛报》的克拉伦斯·佩吉预测说:“这场大选难分伯仲。”《福克斯新闻》的莫妮卡·克劳莉更加夸张,她大胆预测麦凯恩会以0.5个点险胜。只有《新闻周刊》的埃莉诺·克里夫特点明了显而易见的事实,她预测奥巴马最终会当选。

接下来的那个周二,结果出来了,奥巴马以365张选举人票对麦凯恩的173张选举人票当选为下一届美国总统,这一结果与民意测验和统计模型的预测结果基本吻合。虽然不是以压倒性的优势获胜,但也绝不是“难分伯仲”:奥巴马以总选票数高出近1000万张的实力击败麦凯恩,那些预测失败的人该想想怎样自圆其说了。

一周后,“麦克劳夫伦讨论小组”再次迎来上周那4位小组成员,这几位此次对上次预测失败的事情缄口不谈。他们讨论了奥巴马获胜的细枝末节,讨论了奥巴马任命拉姆·伊曼纽尔为下一届美国国务卿,还讨论了他与俄罗斯总统德米特里·梅德韦杰夫的交情。大家对上次失败的预测只字未提——尽管那次预测基本上与当时所有的证据背道而驰,并且还在美国国家电视节目中播出。事实上,小组的几位成员似乎自始至终都认为这样的结果是不可避免的。克劳莉是这样解释的:“2008年本就是个换届年,麦凯恩的竞选宣传太不到位了。”克劳莉似乎忘了仅仅一周前,她还把赌注押在麦凯恩一边。

我们不能单凭一次预测就对一位预言家做出评判,但有一种情况属于例外。截止到美国总统大选前的那个周末,认为麦凯恩仍将获胜的假设中,唯一说得通的也许就是大多数人对奥巴马都存在种族敌意,而这一点在民意调查中无法体现出来。然而,所有小组成员都没有提到这个假设。他们似乎是在另一个世界进行预测,那里没有民意测验,也没有经济崩溃,在那里美国总统小布什仍然很受欢迎,完全没有连累到麦凯恩。

虽然如此,我还是决定研究看看这种情况是否正常。“麦克劳夫伦讨论小组”花钱请来那些以谈论政治为生的专家们,他们是否真有预测的本事?

我对这个节目最后的预测环节中的近千份预测报告进行了评估,这些预测都是由麦克劳夫伦及其节目的其他专家做出的。其中近1/4的预测,要么模棱两可,要么不切实际,想要分析都无从下手。我将剩下的那些预测从完全错误到完全正确分为5个级别。

结果,就好像那些小组成员作预测时用了投掷硬币的方法一样,完全错误或基本错误的预测共有338份,而完全正确或基本正确的预测也是338份。

表2–1 “麦克劳夫伦讨论小组”预测分析

包括成功预测出2008年美国总统大选结果的克里夫特在内,小组成员的预测能力不相上下。我为每个成员计算了一个百分比得分,基本反映了他们预测成功的次数。克里夫特和其他3位参与该节目次数最多的小组成员——布坎南、已故的托尼·布兰科里,还有麦克劳夫伦本人——的分数几乎相同,预测成功比率都在49%~52%。这说明他们预测成功和预测失败的概率是一样的,他们所表现出的政治敏锐度和从理发店走出来的四重唱演员差不多。

当然,从某种程度上来讲,“麦克劳夫伦讨论小组”这档节目不过是供政治狂热者消遣的低俗闹剧,当时此类“声高即有理”的节目很流行,以美国有线电视新闻网的“唇枪舌剑”节目为例,节目中自由派与保守派只是没完没了地与对方争辩。但是,录影棚时代与过去那个“声高即有理”的时代也没有什么不同,只不过现在自由派与保守派都在各自的频道中活动,在电视节目时间表中被美食频道和高尔夫频道隔离在和平地带。这样的安排虽然未见得会催生更加可靠的分析,但看似可以带来更高的收视率。

但是,栏目组花钱请来那些学者讨论问题,初衷是因为他们的判断更准确,学识更渊博,而不是因为他们发表观点时的嗓门够大。那些政治科学家和美国政府的智囊团中的那些分析师怎么样呢?他们是不是更擅长预测呢?

政治学家是名副其实还是徒有虚名

苏联解体与东欧剧变的发生极为突然,但综合各方面的因素进行考虑,这些事情的发生又是顺理成章的。

1987年6月12日,美国总统里根站在勃兰登堡门下,恳请苏联领导人戈尔巴乔夫拆除柏林墙,他的这一令人欢欣鼓舞的建言和当初肯尼迪承诺把人送上月球的誓言一样大胆。里根当时是有先见之明的,因为此后不到两年柏林墙就被拆了。

1988年11月16日,爱沙尼亚共和国(面积同美国缅因州相仿)议会宣布脱离苏联独立。此后不到3年的时间里,戈尔巴乔夫否决了莫斯科强硬派主张的政变,苏联国旗最后一次在克里姆林宫前降下。爱沙尼亚和其他苏联加盟共和国不久后都脱离苏联,各自独立。

如果说苏联的衰亡是有迹可循的,是可以预测到的,然而几乎所有主流的政治学家都没有察觉到这一点。即使有,当时也会被当成笑料。如果那些政治学家连苏联解体都预见不到——也许是20世纪后半叶最重要的事件了——那他们还能做些什么呢?

当时在加利福尼亚大学伯克利分校任教的心理政治学教授菲利普·泰特罗克也有着同样的疑问。苏联分崩瓦解之前,泰特罗克就已经野心勃勃地展开了一项空前的实验。从1987年起,泰特罗克就开始从学术界和政府的各方面专家那里广泛搜集各类关于国内政治、经济和国际关系的预言。

泰特罗克发现,那些政治专家很难预测到苏联解体,因为既要预测到政权的衰亡,又要找到其衰亡的原因,这就需要进行预测的人将不同立场的观点论据穿插在一起。这些观点本身没有什么内在矛盾,但通常是由身处两个不同政治阵营的人发出的,而坚定地站在某一个思想阵营的学者则不可能同时接受两种思想。

一方面,戈尔巴乔夫很明显是这一事件的主角——他是真心诚意地主张改革的。如果戈尔巴乔夫当初选择做会计或是诗人而不是选择踏入政坛,苏联政权也许至少几年内还不至于垮台。自由派对戈尔巴乔夫还是心存同情的,可保守派不愿相信戈尔巴乔夫,有些人认为戈尔巴乔夫的公开讲话不过是故作姿态而已。

另一方面,保守派对共产主义有一种本能的批判。他们很快就认定苏联经济正在走下坡路,普通民众的生活正变得愈加艰难。1990年,美国中央情报局估计——相当不准确的估计——苏联的国民生产总值约为美国的1/2(按人均水平计算,与今天的韩国和葡萄牙这类稳定的民主国家的水平相当)。实际上,最新的证据表明,由于长期陷于阿富汗战争的泥潭,且中央政府对各类社会问题疏于管理,苏联的国内生产总值比美国中央情报局提供的数据还要低约1万亿美元,而且每年国内生产总值缩减的比例都会达到5%,通货膨胀率也高达两位数。

综合两方面因素考虑,苏联解体其实很容易预见。开放媒体和市场,赋予公民更大的民主权利,戈尔巴乔夫为苏联人民提供了一种新机制,以促进社会制度的改革。由于国家经济百废待兴,人们自然乐于支持戈尔巴乔夫提出的机制。然而当时的中央政权已经不堪重负,根本承受不了这种改革:爱沙尼亚人厌恶苏联人,苏联人同样厌恶爱沙尼亚人。各个加盟共和国为苏联经济贡献的力量远远低于他们从莫斯科得到的补助金。捷克斯洛伐克、波兰、罗马尼亚、保加利亚、匈牙利和民主德国都在1989年的改革之列,东欧这些国家一旦像多米诺骨牌一样一个接一个地倒下,不论是戈尔巴乔夫还是别的人,都无法阻止整个国家的土崩瓦解。许多苏联学者看到了这一问题的几个部分,但鲜有专家能把这些碎片拼接起来,因此,几乎没有人能预见到苏联会突然垮台。

受苏联解体的案例启发,泰特罗克开始到其他领域的专家那里进行调查,让那些专家做出各种预测,如海湾战争、日本房地产泡沫、魁北克脱离加拿大统治的可能性,几乎将20世纪八九十年代所有大事件都包括在内。对苏联解体的失败预测究竟是个特例,还是那些“专业”的政治分析者只是徒有虚名?泰特罗克的研究持续了15年之久,他最终将这些研究发表在2005年出版的《专家的政治判断力》一书中。

泰特罗克的结论招来了强烈谴责。他的调查中涉及的那些专家——无论职业、阅历或者研究领域——所作的各项预测的准确率跟碰运气差不多,对未来的政治事件进行预测时,他们预测的准确程度甚至不及那些尚不成熟的统计方法计算的准确度。他们过于自信了,计算概率的能力也很差:他们宣称不会发生的事件中有15%实实在在地发生了,而他们认为绝对会出现的情况中则有25%根本没有出现。他们是否在对国家的经济状况、国内政治或国际事务作预测这点并不重要,重要的是他们的预测全线溃败。

狐狸型专家:善于变通,更善于做出准确的预测

尽管那些专家的整体表现欠佳,但泰特罗克还是发现一些不错的专家。表现不佳的专家往往是被媒体引用预测言论最多的那些人。泰特罗克发现,如果一位专家接受新闻媒体的采访越多,他的预测就可能越不准确。

而另外一些专家的表现相对好些。曾经接受过心理学培训的泰特罗克对那些专家的认知风格很感兴趣,他想看看这些人是如何看待世界的。于是,泰特罗克从性格测试中选取了一些问题,让所有专家作答。

根据诸位专家对这些问题的回答,泰特罗克把他们分为两类,他称其为“刺猬”和“狐狸”。刺猬和狐狸的称呼参照了以赛亚·伯林所写的一篇有关俄国小说家列夫托尔斯泰的散文——《刺猬与狐狸》。而伯林则是借鉴了希腊诗人阿基罗库斯的作品才想到了这一题目:“狐狸千伎百俩而有尽,刺猬凭一技之长而无穷”。

除非你是托尔斯泰的崇拜者,或是对华丽的散文如痴如醉,否则你肯定不会读伯林的散文。不过基本思想是,作家和思想家总是分属两大范畴:

刺猬属于A型性格的人,他们相信“凭一技之长而无穷”,认为自己掌控着世间真理,认为自己就是万物的法则,切实保障着社会的运行。比如马克思和阶级斗争、弗洛伊德和潜意识,或是马尔科姆·格拉德威尔和“引爆点”等。

而狐狸属于一种好斗的人,他们认为“千伎百俩而有尽”,解决问题有许多方法。他们对于琐碎、不确定、复杂或是有分歧的意见更加有耐心。如果说刺猬是猎手,总在不停地寻找大型猎物,那么狐狸更像是一个采集者。

泰特罗克发现,作预测时,狐狸型专家比刺猬型专家考虑得更周全,比如在苏联的问题上,他们的预测就更准确一些。对苏联问题进行预测时,他们没有把这个国家视为一个意识形态符号,既不认为苏联是“邪恶帝国”,也不认为苏联是马克思主义经济体系中一个相对成功(或是举世瞩目)的案例。他们只是客观地看待这个国家:一个濒临瓦解的国家,一个日渐式微的国家。如果说刺猬型专家作预测只能称得上是碰运气,那么狐狸型专家就可谓预测的高手了。

表2–2 狐狸型专家和刺猬型专家的不同态度

刺猬型专家更适合做电视节目嘉宾

一个冬日的午后,我在杜兰特酒店(加州大学伯克利分校附近的一家精品酒店)与泰特罗克共进午餐。他的表现足以证明自己是狐狸型专家:柔声细语,严谨治学,每次回答我的问题之前都会停顿二三十秒(唯恐给我的答复太仓促)。

泰特罗克问我:“成为公众学者的动机是什么?一些学者非常低调、避开公众视线,但另外一些人则急切地想成为公众学者,高调、张扬、引人注目,这样才更有可能吸引众人的眼球。”

换句话说,高调、夸大的刺猬型预测更有可能使你成为电视中的公众人物。曾任美国前总统克林顿顾问的迪克·莫里斯现在是《福克斯新闻》的评论员,他是典型的刺猬型专家,他的策略就是抓住一切机会做出惹人注目的预测。2005年,莫里斯称,小布什总统处理卡特里娜飓风的方式会使他重新赢得民众的支持。2008年美国总统大选前夕,莫里斯预测奥巴马会赢得田纳西州和阿肯色州的竞选。2010年,莫里斯预测共和党人会轻而易举地赢得美国众议院的100个席位。2011年,莫里斯预测唐纳德·特朗普会竞选共和党候提名选人,并极有可能获胜。

然而,所有这些预言最终都落空了。卡特里娜飓风是小布什政府走向终结的开始,奥巴马在田纳西州和阿肯色州的竞选以惨败收场——实际上,奥巴马在这两个州的表现比4年前与小布什争夺美国总统宝座的约翰·克里的表现还要糟糕。2010年11月共和党人确实有所收获,但他们只赢得了众议院的63个席位,而不是莫里斯所说的100个席位。莫里斯坚持认为特朗普会竞选共和党提名候选人,但在他做出预测后仅仅两周,特朗普就宣布退出了。

但是,莫里斯思维敏捷,说话风趣,非常善于推销自己——他在《福克斯新闻》中有固定的栏目,他所著图书的销量也高达几十万册。

狐狸型专家有时对刺猬型专家游走于电视节目、商业和政治活动的做法很难苟同。狐狸型专家认为,许多问题难以预测,所以我们应该对这些不确定性进行解释。他们的这种做派会让人误认为他们缺乏自信,他们的多元方法也被误解为缺乏确定性。杜鲁门总统曾经提出一个著名的论断,说自己需要一个“独臂经济学家”,他觉得那些狐狸型专家根本无法为自己的决策提供任何确定性的意见。

但是,狐狸型专家偶尔也会做出很好的预测。他们能较快地意识到数据的嘈杂,而不去盲目跟踪错误的信号。与刺猬型专家相比,狐狸型专家更清楚自己还有很多无知之处。

如果你想让医生为你预测某种药物的疗效,或是想让投资顾问为你估算养老金的最大回报,那你最好选择狐狸型专家。他们可能会很谦逊地说自己的能力有限,但是成功的把握其实很大。

政治预测为什么常常失败?

在进行政治预测时,狐狸型专家的态度也许尤为重要。在进行政治展望时,刺猬型专家很容易落入陷阱,而狐狸型专家却能小心地绕过这些陷阱。

其中一个陷阱就是党派意识形态。尽管莫里斯一直以克林顿总统顾问的身份出现,却常被视为共和党人,并且为共和党候选人筹集资金,他保守的观点与《福克斯新闻》的风格也很吻合。但是,自由主义者却极有可能成为刺猬型专家。在对“麦克劳夫伦讨论小组”成员预测的精确性进行研究时,我发现,埃莉诺·克里夫特通常是小组成员中最自由的,她几乎从不发表对共和党特别有利的预测,总是跟小组里其他成员的总体意见相左。也许正是因为这一点,她才在2008年美国总统大选的预测中尝到了甜头,然而久而久之,她的预测也和保守派一样不准确了。

与泰特罗克的研究对象相似的那些专家学者,可能都会遇到同样的问题。实际上,对于拥有博士学位的刺猬型专家而言,一知半解是很危险的事。泰特罗克还有一些更重要的发现,其中之一便是,狐狸型专家的经验越丰富,预测就越准确,而刺猬型专家则恰恰相反:他们获得的额外信息越多,表现得就越糟糕。泰特罗克认为,刺猬型专家掌握的事实越多,他们以自己的方式改变且操纵事实的机会就越多,而这些方式往往会强化他们的个人偏见。如果你让一个忧郁症患者待在一个可以上网的黑暗房间里,就会出现类似的情况。你给他的时间越多,他要处理的信息越多,他最后得出的自我诊断也就越荒谬,不久之后,他就会把普通感冒误认为腺鼠疫了。

泰特罗克发现“左翼”和“右翼”两派刺猬型专家都会做出格外差劲儿的预测,但是所有政治派别中的狐狸型专家都不会出现这样的问题。狐狸型专家也许内心也会强烈地期待一种理想状况的出现,但他们在对现实情况和未来可能出现的情况进行分析时,通常可以将自己的理想与现实状况区分开来。

相反的,刺猬型专家总会将自己固有的偏好与分析的问题混为一谈。用泰特罗克的话说就是,他们创作了一个将“真相与个人价值观搅和在一起的混合体”。他们对证据总是带有偏见,仅凭个人喜好取证,不尊重客观事实。

你可以用泰特罗克的测试为自己作个诊断,看看你是不是一个刺猬型的人:在获得更多信息的时候,你的预测准确率是否有所提高?理论上来说,拥有更多信息会让你的预测能力如虎添翼,不过你也可以忽略那些没用的信息。但是,刺猬型专家做不到这一点,他们经常会陷入信息荆棘之中,无法自拔。

《国家政治内幕期刊》(下文简称为《国家期刊》)曾经作过一项调查,对象是政治家、政治顾问、民意测验人和评论员,人数大约为180位。这项调查在民主党和共和党中分别展开,但是两个党派的受访人员回答的问题是一样的。抛开政治派别不谈,这组受访人员都比较接近刺猬型:那些政治活动家以身上的战争创伤为荣,并且发现自己一直都在与另一派别——鸡尾酒会派——进行无休止的斗争。

2010年美国总统中期大选前期,《国家期刊》要求专门小组成员讨论民主党是否有可能继续掌控参众两院。大家几乎一致认为,民主党会掌控参议院,而共和党会掌控众议院(事后证明这两项猜测都是对的),两党的成员也基本同意由共和党获得众议院的大部分席位。民主党的专业人士呼吁本党派要拿到其中47个席位,而共和党则预测民主党将获得53个众议院席位,考虑到众议院中有435个席位,两党之间的预测差别可以忽略不计。

同时,《国家期刊》还要求专门小组成员对11场个人竞选的结果进行预测,包括参议院、众议院和州长竞选,但这一次的预测结果则颇有出入。在预测内华达州、伊利诺伊州和宾夕法尼亚州的参议员竞选、佛罗里达州的州长竞选和艾奥瓦州的关键众议院竞选中,小组成员的意见产生了分歧。整体上看,支持共和党的成员预计民主党只会赢得11场竞选中的一场,而支持民主党的成员则预计自己的党派会赢得6场竞选。(实际结果是两派预测的中间值——民主党最终赢得了11场竞选中的3场。)

很明显,党派偏见对预测产生了一定影响:民主党和共和党成员都会从自己的党派利益出发去考虑问题。然而,这并不足以解释为什么小组成员在回答不同类型的问题时会出现不寻常的分歧。当问及一般问题时,如共和党人可能会有何种表现,小组成员之间的答复几乎没有什么区别。但当问及具体问题时,他们的答案就会大相径庭,党派分歧就会显现出来。

刺猬型专家掌握太多信息可不是一件好事。共和党会赢得多少席位终究是一个抽象的问题:除非你仔细地研究了全部435场竞选,否则没有多余的细节能帮你解决这个问题。相反,当问及某一次竞选时,比如内华达州参议员竞选,小组成员就需要处理各种各样的信息:这些信息不仅包括投票数,还包括自己读到的相关新闻报道、有可能是从朋友中打听到的小道消息,以及他们在电视上看到候选人时想到的。他们甚至与候选人相熟,或者认识候选人身边的工作人员。

刺猬型专家一旦掌握大量信息就会编一些故事,这些故事甚至比真实世界发生的事情更有条理、更加有序,有主角和反派、胜者和败者、高潮和结局,通常以大团圆结局收场。竞选票数低10个点的候选人将会取得最后的胜利,你若问刺猬型专家为什么会这样,他会说,因为“我”了解这个候选人,“我”了解她所在的那个州的选民,“我”还从她的新闻秘书那里听说票数咬得很紧。他还会反问你,你没看过她最新的商业广告吧?

当我们编故事的时候,就无法以批判的方式看待信息。选举通常都是扣人心弦的叙事性故事。无论你怎样看待巴拉克·奥巴马、莎拉·佩林、约翰·麦凯恩以及希拉里·克林顿这些人在2008年的政治表现,你都得承认他们的人生经历确实很有说服力。他们撰写竞选纪实著作,如《规则改变》,它读起来颇像一本畅销小说。参加2012年美国总统竞选的几位候选人虽然没有引起太多关注,但依然使民众过足了戏瘾,从赫尔曼·凯恩的悲剧到里克·佩里的闹剧,全部涵盖在内。

叙事性故事会使人忘乎所以。政治之所以特别容易受错误预测的影响,恰恰是因为其中的人为因素:每一次竞选我们都要投入很多情感。这并不是说,为了对某一政治事件做出准确预测,你对这件事就一定不能带有任何感情因素。但是这再一次表明,狐狸型预测者的冷漠态度更有助于他们做出准确的预测。

狐狸型预测方法

2008年2月,我在新奥尔良的路易斯阿姆斯特朗国际机场候机,我的航班延误了。在等待登机的过程中,我萌生了建立538网站的想法。出于某种原因——也许是卡津马提尼酒在作祟——我觉得应该有人牵头建立一个网站,然后用这个网站来预测奥巴马和希拉里(当时两人还在为争夺民主党总统提名权激战)将如何完胜麦凯恩。这个想法突然间就明朗起来了。

我对政治选举的关注时间可能还要早一些,之所以关注,并不是因为热爱政治,而是对它感到失望。2006年,我曾密切关注过美国国会下令禁止“互联网扑克”这一事件,“互联网扑克”可是我的主要经济来源之一。我发现,即使与体育报道相比,政治报道也依然存在盲区,前者的报道和分析至少借着《点球成金》节目有所改善。

在大选之前,我发现自己越来越关注政治节目,主要收看美国广播电视台、美国有线电视新闻网和福克斯新闻的节目,可大部分内容都索然无味。尽管离美国总统大选还有数月之遥,但各档节目的评论都认为希拉里必然会获得总统提名权,却忽略了民意调查这种方式本身所固有的不确定性。这些评论似乎过于强调希拉里的性别优势和奥巴马的种族劣势,若某个候选人在一场新闻发布会上开了一个机智的玩笑或获得某个无名议员的认可,新闻界就会以此大做文章,断言这个人最终定会获选,可99%的选民都不会在意这些事情。

政治新闻,尤其是那些真正影响美国总统大选的重要新闻,传播速度十分惊人。但是,新闻报道每天都有,且大部分都是用来填充版面的,而媒体却总是将这些报道打造成劲爆新闻。政治新闻报道不仅经常抓不住信号,还时常会强调噪声。如果一个州有大量选票显示共和党领先,而且大家都知道这件事,这就称不上是新闻。如果一个新的投票结果显示该州民主党处于优势地位,即使选票并非来自投票的主要群体,而且也不能准确预测出结果,但也一定会上头版头条。

换句话说,竞争设置的障碍当时已经相当小了。某些人只不过是对政治活动中真正拥有预测能力的事物进行了相当基础性的研究,他们看上去可能就像一个天才了。于是,我开始在Daily Kos网站上发表博文,公开了民意调查和募捐数目这类问题的细节,利用数据对这些问题进行分析。我研究过哪些民调公司在过去这些年的预测最准确,也研究过赢得某一个州(如艾奥瓦州)的选票究竟会对另外一个州的选票数产生多大的影响。尽管像Daily Kos这样的网站上的评论通常都是定性的(而且具有党派取向),而不是定量的(不用数据说话),但是我的那些文章还是很快就有了跟帖。2008年3月,我将作过的分析转到我自己创建的538网站上,旨在对美国总统大选进行各种预测。

起初,538网站的预测模型十分简单——基本上总是取自民意调查的平均值,但会根据之前的准确程度给这些调查加权——后来就逐渐变得比较复杂了,但预测模型始终遵循三大原则,而且这些原则都是典型的狐狸型原则。

原则一:用概率的方法思考问题

几乎我发布的所有预测,不管是政治方面还是其他方面,都是以概率的形式公布的。我不会随便给出一个准数或声称某事一定会发生,只会给出几个可能的结果。比如,2010年11月2日,在预测共和党会赢得多少众议院席位时,我的估计正如图2–1所示。

图2-1 2010年11月2日,538网站预测模型对众议院席位的预结果测示意图

可能性最大的几个结果——足以覆盖所有可能出现情况的1/2——显示,共和党会获得45~65个席位(实际上获得63个)。但是,也存在共和党会获得70或80个席位的可能性——这个数字与莫里斯当时预测的100个席位仍然相去甚远。而另一方面,民主党也有机会获得足够的席位以保住对众议院的控制权。

结果的广泛分布就是现实世界不确定性的真实体现。这个预测结果是在对435个席位中的每个席位分别进行预测之后得出的,其中多数席位的预测概率极为接近。尽管如此,仍有引人注目的77个席位的预测概率相互之间的差别大到个位数。如果当初民主党人在大部分有竞争力的地区能多赢得一些票数,哪怕是很少的一些,他们就能打败预测结果,轻松地保住对众议院的控制权。而如果共和党人采取了与他们的实际做法相反的做法,他们在众议院中的席位肯定也会低到让人大跌眼镜。政坛上,一颗小石子就会激起轩然大波,所以,预测时列出确切的数字肯定不是明智之举。

当我对某个竞选个案进行预测时,概率原则依然成立。比如,若民调显示某位候选人领先5个点,那他获胜的概率有多大?这就是538预测网站试图解决的问题。

参选人能否获胜在很大程度上是由他参与的竞选活动的类型决定的。竞选级别越低,民调的不稳定性就越大:美国众议院选举的民调就不如参议院的精确,参议院选举的民调就不如美国总统大选的精确。初选的民调结果与最终大选的民调结果更是相差甚远。2008年民主党初选期间平均票数丢了8个点,比预想的误差幅度大得多。2012年共和党初选时民调的情况更糟糕。实际上,在许多主要的州,如艾奥瓦、南卡罗来纳、佛罗里达、密歇根、华盛顿、科罗拉多、俄亥俄、亚拉巴马和密西西比,民调中处于领先地位的候选人往往一周后就会落败。

但到了临近大选那几天,民意调查就会越来越准确。表2–3展示了538预测模型对参议院选举结果进行预测后做出的简化图,该模型运用1998~2008年的数据,根据美国候选人领先民调的平均得票情况推断其获胜的概率。比如,某位参议院候选人在选举前一天领先5个点,且以往他选举获胜过,那么他此次获胜的预测概率高达95%,尽管新闻报道还会说这次竞选“难分伯仲”,但其实这次竞选他几乎已经胜券在握了。相反,如果是大选前一年领先5个点,那么他此次获胜的预测概率仅为59%,这个概率跟掷硬币作决定差不多。

表2–3 根据参议院候选人领先民调的平均得票情况预测其获胜的概率

这样,538网站的预测模型的价值就显现出来了。有了它,人们就可以非常轻松地对大选进行预测,观察一个候选人是否在全部或者大部分民调中都处于领先位置,判断他是否会成为最终获选的幸运儿(除了少数例外情况,这一假设还是正确的)。预测候选人获胜的准确概率其实更难。我们的大脑处于高度探测模式,一直都在寻找信号,但同时我们也应该对得到的数据的干扰程度进行甄别。

对于这种思考方式我已经习以为常了,因为我的专业背景主要包括两大学科:体育运动和牌类游戏。浸淫在这两个领域中,你会明白什么叫见惯不怪。牌类游戏玩多了,你会轻而易举地抓到“皇家同花顺”,久而久之,当你的对手抓到一手“同花”牌时,你的牌可能已经满堂红了。体育运动,尤其是棒球,其中也有很多出现概率很低的事件最终实实在在地发生了。2011年,波士顿红袜队当时有99.7%的机会成功打入季后赛,可还是铩羽而归。对此我很无奈,只能说,一般的概率法则对红袜队和芝加哥小熊队不起作用。

然而,政客和政治观察员对这种不确定性却深感不满。2010年,一个民主党的国会议员在美国总统大选前几周给我打来电话。他代表西海岸一个民主党占绝对优势的地区,但是考虑到共和党当年的良好表现,他还是很担心会丢掉自己的位置。他想知道的是,我们的预测会有多大的不确定性。我们为他提供了一个估值:民主党的获胜概率无限接近100%。但近似100%指的是99%、99.99%还是99.9999%呢?如果他落选的概率只有十万分之一,他就应该把自己的竞选基金捐赠给民主党优势不够明显的地区的候选人。但现在一切都不确定,他连1%的风险也不愿意冒。

同时,不同政治派别还会对你预测中的不确定性进行曲解。他们认为你是在两面下注,你在为可能出现的预测失误找借口。实际上不是这样的。如果你预测某位现任国会议员获选的可能性为90%,你同时也是在预测他有10%的可能性落选。一个出色的预测的标志是,每一个概率最终都会被事实证实是正确的。

泰特罗克所定义的刺猬型专家对概率的理解尤其差劲。当你说某个事件有90%的概率会发生时,这句话本身拥有非常具体且客观的意思,但我们的大脑却会把这种说法转变为比较主观的推测。心理学家丹尼尔·卡尼曼和阿莫斯·特沃斯基给出的事例表明,这些主观推测通常并非总是与客观事实相吻合的。一架飞机安全着陆的概率是90%、99%或者是99.9999%,我们看不出这3个数字有多大差别,但是在考虑应该订哪个航班的机票时,这3个概率对我们而言立即有了天壤之别。

多加练习,我们的预测就会变得更准确。泰特罗克所定义的那些刺猬型专家与其他人的不同之处在于,他们很固执,不愿意从自己的错误中吸取教训。想让他们承认自己对这个真实世界的预测存在不确定性,就相当于让他们承认自己对这个世界发展趋势的论断存在不足,这是所有理论家最不情愿做的事情。

原则二:今天的预测是你以后人生的第一个预测

另一个误解是:一个成功的预测不会改变。当然,如果你的预测结果每天都会出现巨大的波动,那可能就是一个不好的预示——不是设计的模型很差劲儿,就是你的预测对象根本不具备可预测性。2012年,在各州公布共和党初选的预测结果之前,我抢在他们之前发布了自己的预测结果。我只是根据民调结果进行预测,这些概率经常会随着民调结果的变化而变化。

若结果的可预测性更强——比如美国总统大选到了竞选后期——预测结果通常会更加稳定。2008年美国总统大选之后,我听到来自民主党最多的评论就是,他们向538网站求助以稳定党内人心。到了总统竞选后期,各个州每天会发布近三四十份民调结果,其中一些不可避免地会出现很大的偏差。那些喜欢把竞选气氛变紧张的候选人、战略家和电视评论员可能会把重点放在局外人的民意调查上,但是538网站的预测模型发现,这些民调不会对大选结果产生太大影响。

最根本的是,不管你上周、上个月还是去年说了什么,“今天做出最好的预测”才是应有的态度。做出新的预测并不意味着旧的预测不复存在了(最好对整个预测过程做个记录,并请人对你的预测效果进行评价)。但是,如果确定昨天的预测是错误的,那就没必要坚持了。经济学家约翰·梅纳德·凯恩斯有一句著名的论断:“当实际情况发生改变时,我的想法也会随之改变,你是怎么做的呢?”

有些人不认同这种进程–修正分析的方式,误认为那是软弱的表现。改变想法似乎是在欺骗自己——无异于伸出手指去测量风向。批评家通常含蓄或明确地认为,政治与物理、生物等学科类似,本身就应当遵循可知性和可预测性等基本法则。(我接触最多的批评家中有一位是普林斯顿大学的神经科学教授。)这样看来,新信息就不那么重要了,各种竞选就像冲向地球的彗星一样,应当沿着可预测的轨道行进。

然而,选举预测与物理和生物不同,倒是有点接近扑克牌游戏:我们可以观察对手的行为,从中找到一些蛛丝马迹,但是我们看不到他的牌。更新、更好的信息会不断出现,所以,只有时刻更新预测才能最大限度地利用有限的信息。因为害怕出丑而不对预测进行更改,这其实才是懦弱的表现。

原则三:寻求共识

每个刺猬型专家都幻想着自己能做出大胆、无畏又与众不同的预测——对一个话题的看法一定要跟众人的意见迥然不同才行。刺猬型专家遭受同事的排挤,就连家里的金毛猎犬也认为他们有些滑稽。但很快,结果证明他们做出的预测完全正确、绝对正确、不容置疑地正确。两天后,他们上了《华尔街日报》的头版,同时附有一张照片,他们坐在杰伊·雷诺的沙发上,个个都像大胆而勇敢的先驱。

这样的预测可能偶尔是正确的。专家的共识也可能会出错——如果当初某个专家预测到苏联解体,那他一定会受到此生最大的褒奖。然而,幻想的情节终归难以成真。狐狸型专家——包括我本人在内——虽说不是墨守成规的人,但当我们的预测与竞争对手的大不相同时,我们总会感到忧虑。

许多证据表明,群体预测要比个人预测准确,其准确率随预测领域的不同通常会高出15%~20%。这并不是说群体预测就一定是准确的(我们会在本书稍后的部分对这个主题进行深入探讨),但从多个角度考虑问题总会大有裨益。

泰特罗克曾经对我说:“狐狸型专家通常会独立思考问题,而刺猬型专家则习惯与别人共同商讨问题。”他的意思是,狐狸型专家已经培养出一种仿效集体决策过程的能力。他们不再咨询整个专家组,而是不停地向自己发问。通常这就意味着他们需要将很多不同类型的信息集合起来——就像一组各持己见的人真正要做的那样——他们会客观地对待所有信息,而绝不会把某一条信息当成金科玉律。(以538网站的预测为例,这些预测通常会把民调数据和经济、各州人口统计等有关信息综合起来)。那些没有留心泰特罗克指导意见的预测者,总要为此付出代价。

2000年美国总统大选前夕,经济学家道格拉斯·希布斯公布了一个预测模型,声称依据经济增长和战争伤亡率这两个变量,就可以非常准确地预测出总统大选的结果。希布斯提出了一些十分大胆的刺猬式主张,他认为依据总统的支持率(通常这是总统能否连任的可靠信号),根本不会提高预测的准确性,对通货膨胀率和失业率有所了解同样也不会提高预测的准确性。候选人的身份无关紧要:一个政党既会推荐乔治·麦戈文那种有着强烈党派意识的议员,也会推选德怀特·D·艾森豪威尔那样的中间派战争英雄。希布斯断言,关键的因素是一个相对模糊的经济变量,即被命名为“实际可支配的人均收入”。

那么,希布斯的预测模型究竟得出了什么结果呢?它预测戈尔会获得压倒性胜利,并且说他最终会以9%的优势取胜,但在佛罗里达州重新计票之后,获胜的却是小布什。戈尔确实赢得了美国普选,可这个预测模型表明,美国总统大选结果和预测结果会有天壤之别,且出现预测结果的概率只有1/80。

还有其他几种预测模型也采用相似的方法,把美国总统大选这类复杂的问题用“两个变量”的方程式解决(奇怪的是,这些模型中所用的两个变量五花八门)。实际上,在这些预测模型中,有些模型的跟踪记录远不及希布斯的预测模型准确。2000年,其中一个预测模型预计戈尔会以19个点取胜,甚至还预测小布什只有十万分之一的概率获胜。

这样的预测模型在1988年美国总统大选之后开始盛行,因为在这次竞选中此类模型的基本变量一直偏向老布什一方——经济运行良好,老布什代表的共和党有一位颇受民众欢迎的前任总统里根——但直到本次大选后期,民意调查都是偏向迈克尔·杜卡基斯一方的。最终,老布什轻松获胜。

然而,尽管这类预测模型越来越多,但它们的跟踪记录却很差。1992年以后的5次美国总统大选中,这个“基于基本变量”的典型预测模型——它忽略了民意调查,声称在没有相关信息的情况下仍可辨清选民的动向——结果漏掉了几位主要候选人之间高达7%的点数差距。而采用狐狸式方法的预测模式,把经济数据、民调数据以及其他类型的信息结合在一起,得出了更为可靠的预测结果。

定性信息与定量信息同等重要

虽然这些“魔法子弹”式(结果发生逆转)的预测模式依据的是定量信息,比如已公布的经济统计数据,但还是失败了。实际上,本书所引用的那些最差劲的预测案例有些就是定量分析的案例。比如,那些评级机构就是运用不同模型对不同类型的抵押贷款的违约率进行预测,它们得到的都是精确到具体数据的估值。然而这些模型却漏洞百出,因为它们依据的是一种利己假设——不同抵押贷款之间的违约风险互不相干——这一假设在房地产市场和信用泡沫中完全行不通。当然,我自己在作预测时也非常喜欢运用定量的方法。刺猬型专家会接收各种类型的信息,并借助这些信息强化他们的偏见,而狐狸型专家则会对不同类型的信息进行总体权衡,将定性分析和定量分析结合起来,所以能经常做出正确的预测。

说到预测成功率,没有几个政治分析家能比得过“库克政治报道”这样一个紧密团结的团队。来自路易斯安那州的查理·库克长了一张友善的圆脸,他在1984年组建了这个团队,当时在贝尔特威以外的地方几乎没有人听说过他们。但是,政治狂热者多年来一直十分信任库克团队的预测,而且这个团队也几乎没让他们失望过。

库克和他的团队有一项特殊使命:对全美各级选举的结果进行预测,特别是对美国国会的选举结果进行预测。这就意味着,每隔一年,他们就要对外发布对美国众议院全部435场竞选结果的预测,还要发布对美国参议院大约35场竞选结果的预测报告。

预测美国参议院选举或是州长竞选的结果相对简单。因为选民一般对这些候选人都非常熟悉,这些最为重要的竞选活动往往会引起广泛关注,还会有声誉良好的公司定期进行民意调查。在这种情况下,想要像我在538网站中那样改进收集民调结果的方法并非易事。

而美国众议院选举就完全是另外一番景象了。候选人通常身份比较低微,其中包括那些想在美国政坛一展身手的市议会议员或小企业家,而且在选举前,这些候选人一般不为选民所熟知。同时,美国国会选区几乎遍布全国各个角落,全美国人都被调动起来了。如果有人能够提供众议院选区的民调结果,这个结果必定是最起伏不定的,当然通常情况下几乎没有人能提供。

但这并不意味着像库克这样的分析家就无从知晓信息了,事实上,他们得到的信息量很大:除了民调结果,他们还知道某个选区的人口数据,也了解该选区此前几次选举的投票情况。他们还掌握了美国党派的总体发展趋势的数据,比如现任总统的支持率。此外,他们甚至能得到必须上报美国联邦选举委员会的筹款数据。

除了上述信息,其他类型的信息更偏向于定性信息,但同样很重要。比如,这位候选人是一个出色的公共演说家吗?她所在选区的政纲基调是什么?她的竞选口号是什么?政治活动其实就是一个小公司,她能管理好自己的职员吗?

当然,如果你是一个不仔细权衡定性信息的刺猬型专家,那么所有的信息就只会给你带来麻烦。库克的团队在预测方面很有经验,准确度也很高。

库克团队把竞选划分为从“共和党必胜派”到“民主党必胜派”7个等级。1998~2010年间,库克团队成功预测共和党候选人获胜的次数为1205次(共1207次竞选),达到了99%以上的成功率,同样的,他们成功预测民主党候选人取胜的次数为1226次(共1229次竞选)。

库克提到的那些“民主党必胜派”获胜的选区几乎每年都是民主党获胜,“共和党必胜派”获胜的选区每年则都是共和党获选,这些预测都不难作。但是,在需要高技术水平的竞选预测中,库克团队同样表现不俗。比如,在被他们列为“倾向于”共和党候选人的那些选举中,共和党实际获胜的概率高达95%;在被列为“倾向于”民主党候选人的选举中,民主党获胜的概率高达92%。此外,即使库克团队并不赞同民调那样的定量指标,但他们在相关预测中仍然拥有良好的跟踪记录。

2010年9月,大概是2010年11月选举活动开始前5周的光景,我在华盛顿拜访了库克团队,整个下午,我都和戴维·瓦瑟曼在一起,他的年龄约为30岁,一头卷发,负责管理众议院的预测事务。

库克团队最具特色之处就体现在他们与候选人的面谈环节。美国总统大选期间,位于水门综合大厦5楼的库克工作室入口处总是人头攒动,候选人时不时地过来聊上个把小时,谈论的话题无外乎是筹款和战略会议。我拜访瓦瑟曼那天,他安排了3场面谈。他让我和一个叫丹·卡潘克的共和党候选人一起与他见面。卡潘克想要击败威斯康星州第三国会选区的现任民主党议员罗恩·坎德,这个选区包含这个州西南部的几个小社区。库克团队已经将这次竞选认定为“民主党可能获胜”,也就是说卡潘克获胜的概率很低,但是他们当时正在考虑将这一选区改为形势更有利的“民主党必胜”区。

做农场补给生意的州参议员卡潘克举止粗暴,像个高中体育老师。他还有一口浓重的威斯康星州口音,当他谈到自己拥有一支名为“拉克洛斯罗格”(La Crosse Loggers)的小型联盟棒球队时,我都不确定他说的是“logger”(伐木工),还是“lager”(一种淡啤酒的牌子),哪个词听上去都像是这个来自威斯康星州的俱乐部的别名。不过,他朴素的话语使人可以多少忽略其举止的粗暴,所以在通常民主党占优势的选区,他也始终能在州议会中任参议员。

然而,瓦瑟曼在面谈时运用了一些扑克牌游戏的规则。他一脸严肃且不失职业风范,但他会巧妙地给候选人施压,以找到更多信息。

他对我说:“我的基本技巧是,在面谈开始时让候选人谈谈自己的情况,从而营造一种舒适友好的气氛。然后,我试着提一些尖锐的问题,比如,说说你在哪些问题上与你所属党派的领导人意见不同。这么做的目的并不是让他们提供解决办法,只是想要了解他们的作风和处事方法。”

与卡潘克的面谈就是按照这一模式进行的。瓦瑟曼对选区的政治、地理状况无所不知,这使他看起来很像一个当地人,卡潘克也乐于谈论有关他所在选区的复杂情况,例如他在拉克洛斯需要获得多少票数才能弥补他在奥克莱尔丢掉的选票。他啰啰唆唆地说了几个问题,主要内容是他用说客们游说得来的捐款为俱乐部买了一个全新的棒球场。

这都是一些小事,远不及卡潘克因为婚外情和偷税漏税被起诉来得重要。这两件事足以劝阻瓦瑟曼不要改变评价。事实上,尽管那年11月共和党在中西部相似选区的大部分竞选中都取得了胜利,但卡潘克本人还是以9500张选票的差距落选了。

事实上,这种情况很常见。面谈之后,瓦瑟曼通常会保持(与面谈前)同样的评价。尽管他努力地从候选人那里收集新信息,可还是不能推翻他之前对竞选结果的看法。

瓦瑟曼的方法之所以奏效,是因为他能在不受对面这位候选人影响的情况下,对信息做出评价。能力不足的分析师不是表现得像是被迷惑、被欺骗、被耍弄,就是在竞选活动中迷失自我。或者,他们只顾着对自己与候选人谈话时所使用的技巧感到沾沾自喜,却忽略了其他所有与竞选相关的信息。

而瓦瑟曼会考虑更大的政治背景中的每一件事。极其优秀的民主党候选人,即使面谈时表现超级棒,可能也没有机会在共和党通常获胜的选区取胜。

那为什么还要费时费力地与候选人进行面谈呢?这主要是因为瓦瑟曼在寻找危险信号,就像那次与民主党议员艾瑞克·马萨(在传出性丑闻之后突然从国会辞职)面谈一样。心理学家保罗·米尔将这些情况称为“断腿”情况,即如果一件事情太过招人耳目,那么不对它进行解释说明就是不明智的。

这种现象,每年瓦瑟曼都会遇到几例,这使得他能够正确预测更多的竞选。他能够从面谈中得到足量但不过量的信息。信息是定性的还是定量的,这并不重要,重要的是你怎样使用这些信息。

做出客观的预测并非易事

在本书中,我使用“客观”和“主观”这两个词时,都非常谨慎。“客观”有时被认为是“定量”的同义词,其实不然。它的实际意义是超越我们的个人喜好和偏见,去寻找问题的真相。

在这个世界上,纯粹的客观性是求之而不得的。进行预测时,我们可以选择很多不同的方法。有些方法可能单纯依赖定量因素,比如民意调查,但是瓦瑟曼的方法也将定性因素考虑在内。然而,所有这些决定和假设都要由预测人做出。人为的判断终究会存在潜在的偏见。只有认识到假设对预测的影响,并从自身找问题,才能做到更加客观。在政治预测上,我们穿梭于意识取向和行为倾向之间,在嘈杂的数据中理顺客观事实,这是相当困难的。

所以,你需要从电视评论员身上学习一些不同的习惯,学会怎样表达预测中的不确定性,并使其量化。随着事实和环境的改变,你的预测也要跟着更新,你要试着发现,从不同视角看世界也会得到智慧。只有这样,评估各式各样信息的能力才会越来越强,而不至于滥用这些信息。

简而言之,你需要学习狐狸型专家的思维方式。狐狸型专家认识到了人类在预测世界进程时所作判断的局限性。认识到这些局限,才能做出更准确的预测。 WXBYevNAF8tjmuZbsO5EUtzu9r6Ye0qn31R1ydc9nD2AxJuvxTEo3Hj5pvNOwBj4

点击中间区域
呼出菜单
上一章
目录
下一章
×

打开