购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

CHAPTER 5
第5章
贝叶斯规则

学习是市场和博弈中调整(adjustment)的重要组成部分。最简单的一种情况是,一个人开始对一种未知的情况有一些初步的信念(belief),例如,一家公司是否会宣布破产,然后观察新的信息,例如,销售报告。在形成新信念的过程中,最初的信念和新的信息以某种方式结合在一起。本章是关于新信息到达后,信念概率如何更新的基本理论,这就是贝叶斯学习(Bayesian learning)。讨论是依据一个简单的基于频率或“计数”直觉推断法来解释贝叶斯规则(Bayes' rule),这是一个更新信念的数学公式。

教师须知: 本章使用的信念诱出实验均可通过Veconlab网站中的“贝叶斯规则”程序实现,在“决策”菜单下选择BDM 选项(另外的选项QSR和彩票选择,将在第6章讨论)即可。基于网页的贝叶斯规则程序操作快捷方便,还能自动完成计算,并绘制平均诱出概率的图形(作为贝叶斯预测的函数)。

5.1 引言

假设你刚刚收到一份体检报告,显示你患上了一种罕见疾病。在你所在的社会经济群体中,该病的基础概率(base rate)或者说发病率为1‰(0.001)。很不幸,这种疾病是致命的;但你还是有希望的,因为测试结果可能会产生假阳性(false positive)。医生告诉你:如果你确实患病,检验结果100%将呈阳性;但即便你没有患这种病,检验结果也有1%的可能呈阳性,即假阳性。问题是,在检测结果呈阳性的情况下,利用这些信息来确定你患这种罕见疾病的概率。请现在就把你的猜测写在一张小纸片上,以免忘记。

我认为患这种病的概率为:______/100

面对这个问题,大多数人会得出结论,更有可能的是这个人实际上患有这种疾病,然而,这样的猜测可谓大错特错。1%的假阳性意味着,随机选择1000人进行检测,将会有10个阳性结果(1%),但平均1000人中只有1个人真正患病(检测结果当然也为阳性)。在10名假阳性和1名真阳性的情况下,在看到阳性检测结果后患病的概率只有1/11,即使你的测试结果是阳性的,准确率为99%。这个例子说明了,关于总体中某些属性的“基础概率”的先验信息的巨大影响。这个例子还说明了如何设置一个简单的基于频率的计数规则,该规则将提供近似正确的概率计算:

(1)假设一定数量的样本(比如说1000人)。

(2)利用基础概率计算样本中平均会有多少人患病,用基础概率乘以样本容量(如,0.001乘以1000等于1)。

(3)接下来,计算出该疾病患者的阳性检测结果的预期数量,即真实阳性(本例中,1000人中平均有1人确实患病,体检也将呈阳性,也就是说所有患者中有1名“真阳性”)。

(4)从总样本中减去实际患病的期望人数(第2步),从而估计未患病的人数(1000-1=999)。

(5)估计未患病人群中体检结果为(假)阳性的人数(本例中,假阳性的比例为1/100,所以,未患病的人的“假阳性”人数是999/100,也就是9.99,大约是10人)。

(6)通过计算真阳性人数(第2步)与总阳性人数(真阳性(来自第2步)和假阳性(来自第5步)的总和)的比值,计算出给定阳性检测结果的患病概率。例如,这个比率是1/(1+9.99),约为1/11,即9%。

以上计算过程运用到了贝叶斯规则。本章介绍了这一规则,它是利用先验信息(如,总体基础概率)和新信息(如,测试结果)的最佳过程。正如对疾病问题的不正确答案所表明的那样,在这种情况下的决策和推断可能会有严重的偏差。由此引出的一个问题是,如果提高激励且能够从经验中进行学习,那么人们能否修正潜在的偏向;在一些(并不是全部)情境中,不能修正偏向的人将会把机会拱手让予完成修正的人。

获得新信息时,辨别以下三个要素将很有帮助:初始信念、获得的信息以及获得信息后的新信念。如果初始的先验信念根深蒂固,那么,除非新信息的质量非常高,否则新的后验信念并不会发生多大变化。因此,学习过程同时涉及先验信念和新信息,以及二者的可靠程度。例如,若调查人员几乎肯定嫌犯有罪,那么即便后者通过了测谎仪的测试,也不能消除前者的怀疑。另一方面,高质量的信息则有可能推翻先验信念,比如DNA证据可洗清嫌疑。贝叶斯规则提供了处理多来源信息的数学方法。采用该视角的有用之处在于,规定了如何根据不同信息源的可靠性做出评估。虽然某些类型的先验信息并不可取或不合时宜(如,陪审团在严肃的审判中,根据种族或其他人口特征判断被告犯罪的概率),但是该视角仍然不失其价值。在这类情况下,了解如何使用类似的先验信息(贝叶斯规则下),将有助于防范那些源于信息的偏见。最后,贝叶斯计算还为我们提供了度量心理偏向的一种标尺。

5.2 一个简单的例子和计数直觉推断法

最简单的信息问题是决定两种可能的情况或“自然状态”中哪一种是适宜的,例如,有罪或无罪,已感染或未感染,有缺陷或没有,等等。具体地,假设有两只杯子或者“罐子”,装有大小相同的黄球(a)和蓝球(b),如图5-1所示。A杯中有2个黄球和1个蓝球,B杯中有1个黄球和2个蓝球。采用掷硬币的方式选择一只杯子,具体是A杯还是B杯暂时保密,故在先验信息里两只杯子的概率相等。接下来,被试将观察到从该杯子中抽取的若干小球,每次抽取后小球都将被放回。因此,这里的抽取小球属于放回抽样(with replacement),杯中的球不会随着抽取发生改变。

图5-1 两只杯子的例子

假设第一次抽出的是黄球,请你回答此时选中的杯子是A杯的概率,用Pr(A|a)表示。有时候人们回答1/2,因为他们觉得两只杯子被选中的概率相等。诚然,事先两只杯子被选中的概率的确相等,但是,从抽出的小球中我们又学习到了什么呢?

另一种常见的答案是1/3。因为A杯被选中的概率为1/2,而从中抽出黄球的概率为2/3,1/2和2/3相乘得到1/3。但是,对数学的一知半解是非常危险的!这个答案显然不对,因为事前两只杯子概率相等,而抽出黄球意味着此时A杯可能性增加,故抽出黄球后A杯概率势必大于1/2;该答案的另外一个问题在于,若用同样方法计算B杯概率,即1/2×1/3=1/6,将出现前后矛盾,A杯概率1/3、B杯概率1/6,余下的概率到哪里去了呢?以上A和B的概率(1/3和1/6)之和仅为1/2,或许我们可以将其翻倍(为2/3和1/3),即为抽出黄球后杯子为A和B的概率。稍后会看到,这种概率的等比例放大是贝叶斯规则数学公式的一环(你马上就会见识到公式中“麻烦的分母”了)。

仔细观察图5-1中黄球的分布,有助于理解为何在抽出一个黄球后A杯的概率为2/3。

图5-1中,左侧A杯中有2个黄球(标记为a),右侧B杯中只有1个。掷硬币选择杯子前,全部6个小球每个被抽中的概率相等,没有哪个黄球概率高于其他小球;而3个黄球中有2个在A杯,A杯中抽出黄球的后验概率为2/3。换言之,此时有两个真阳性的黄球(在A杯中)和一个假阳性的黄球(在B杯中),于是,A杯概率即为真阳性与全部阳性数量(不论是否为真)之比,Pr(A|a)=2/3。

以上为贝叶斯规则的一个特例,两只杯子的先验概率相等。现在,让我们设想先验概率不等的情况。具体而言,假设第一次抽中黄球并放回,之后继续在该杯(A或B)中抽取一次。由于已经抽中一次黄球,第二次抽取前的信念里,A杯概率为2/3,B杯概率1/3。也就是说,抽中一次黄球后,此杯为A的概率是B的2倍。

下一步的问题是,如何调整之前计算小球的方法(两种杯子的初始可能性相等),使之适用于概率不等的情形。为了营造和新信念一致的情境,我们可以假想,概率更高的杯子中小球的数量翻倍。尽管每只杯子中实际的小球数量未变,但为了表示新信念,我们可以认为A杯中的小球数是B杯的2倍,同时每只杯子里小球被抽中的概率均等。这种后验信念如图5-2所示,A杯和B杯中小球比例未变。虽然实际小球数仍为6个,但在图5-2中,小球(真实和假想的小球)有9个之多,从1到9编号、随机抽取。

第一次抽中黄球后,后验信念如图5-2所示。可见,如果第二次抽中了蓝球,那么它来自两只杯子的概率相等,因为两只杯子中都有2个蓝球,故此时A的后验概率是1/2。这一结果和基于对称性的直觉一致:抽取之前,两只杯子的先验概率均为1/2,而抽中黄球(第一次)与抽中蓝球(第二次)又相互平衡。当然,即便小球的顺序相反(先蓝后黄),这一结果也不会改变。

依然假设事前两只杯子概率相等,而前两次都抽中黄球。和之前一样,第一次抽中黄球之后的后验概率如图5-2所示。由于5个黄球(真实和假想的)中有4个在A杯,再次抽中黄球意味着A杯的后验概率达到4/5,达到了B杯的4倍。为了用等概率的小球表达更新的后验信念,A杯一侧的小球数应为B杯的4倍。因此,我们需要在图5-2中的A杯里再加两行,每行有3个假想的小球,黄球和蓝球的比例与之前相同,由此得到图5-3。

图5-2 第一次取出黄球后的假想模型(粗体表示真实的小球,非粗体表示假想的小球)

图5-3 连续两次取出黄球后的假想模型

至此,你可以尝试思考抽取出2个黄球和1个蓝球之后是A杯的概率。解题的时候,你需要考虑在图5-3中A杯里有多少个蓝球(既包括真实的,也包括假想的),B杯里又有多少。

5.3 计数直觉推断法与贝叶斯规则的关联

截至目前,分析都停留在直觉层面,而本章后续将侧重于解析。引入更多符号有助于在计数直觉推断法和贝叶斯规则公式之间建立联系。假设每只杯子中有 N 个小球,仍分为a(黄色)和b(蓝色),因此“样本”s可以是a或b,也就是黄色或蓝色。我们想要知道的是,当抽到颜色s的小球后是A杯的概率。前文已知若s为黄色,如图5-1所示,答案为2/3,但在此处我们的目标是找到一般化的计算公式,计算给定颜色s时A杯的概率。此概率可表示为Pr(A|s),读作“取出s球时所选自A杯的概率”。我们所要寻找的公式必须足够一般化,能够应对不同的小球比例,以及各种先验概率。

反过来,Pr(s|A)为选中A杯时抽出s球的概率,相较于Pr(A|s),A和s的顺序颠倒。Pr(s|A)对应A杯中s球占比(s可黄可蓝)。相似地,Pr(s|B)对应B杯中s球占比。举例来说,A杯中有10个小球且Pr(s|A)=0.6,该杯中s球的数量便是6(0.6乘10)。更一般化地,A杯中s球的总数为Pr(s|A) N ,B杯中s球的总数为Pr(s|B) N 。如果两只杯子被选中的概率相等,那么事前(选定杯子之前)全部2 N 个小球被抽取的概率也均等。假设抽出s球,换句话说,颜色s是来自“样本”的信息。此时,所选杯子为A杯的后验概率,表示为Pr(A|s),乃是A杯中s球的数量与两只杯子中s球总数之比:

可表示为

式(5-2)中的分子可理解成真阳性的数量,分母则为全部阳性的总数,无论真假。值得强调的是,式(5-2)只适用于先验概率和杯中小球数都相等的情况。如果我们将右侧的分子和分母同除以两杯中小球的总数2 N ,便可得到先验概率为1/2时的后验概率计算公式:

目睹一次或多次小球抽取的结果之后,先验概率不再是1/2,该公式需要更加一般化——将上式右侧的1/2替换为新的先验概率,表示为Pr(A)和Pr(B),即为贝叶斯规则:

前例中先验概率相等,意味着Pr(A)=1/2,且Pr(a|A)=2/3,Pr(a|B)=1/3因此通过式(5-4)可以算出抽中一个黄球后选中杯子为A的后验概率等于:

相似方式可算出是B杯的概率:Pr(B|a)=(1/6)/(2/6+1/6)=1/3。注意,两式中分母均为1/2,而除以1/2等于将分子放大至2倍,保证两个后验概率之和等于1。这就是经常被遗忘的分母存在的意义。

简而言之,如果两只杯子的先验概率均为1/2,且小球数量相等,那么后验概率的计算方式如式(5-1),等于抽中颜色的小球在杯中的数量与其在两杯中总数之比。如果抽中s球,那么该球出自A杯的概率即为A杯中s球的数量与两杯中全部s球的总数之比。当先验概率或者两只杯子中小球的数量不等时,式(5-3)中的1/2项需要替换为先验概率,得到贝叶斯规则的式(5-4)。通常情况下,放回抽样时样本s都不只包含一次抽取,但此时式(5-4)仍适用。总结如下:

贝叶斯规则: 在观察到信息s后,事件A的概率如式(5-4)所示,等于A为真时信息s出现的概率比上信息s出现的概率(不论A的真假)。

举例来说,假设样本中包含两次a和一次b(放回抽样),杯子情况仍同图5-1。因此,观察到的样本s为aab、aba或baa,取决于小球被抽中的顺序。如果所选杯子为A,每种结果出现的概率均为A杯中三次独立抽取概率之乘积。例如,Pr(aab|A)=(2/3)×(2/3)×(1/3)=4/27。由于样本s包含以上三种结果,故Pr(s|A)=3×(2/3)×(2/3)×(1/3)=4/9。同理,Pr(s|B)=3×(1/3)×(1/3)×(2/3)=2/9。将它们代入贝叶斯规则式(5-4)中,加之两只杯子的先验概率均为1/2,便可计算出当样本为两次a一次b时的正确答案Pr(A|s)=2/3。(从直觉上来看:由于两只杯子被选中的概率相等,其中的一次a和一次b相互“抵消”,所以当看到两次a和一次b之后,A杯的后验概率等价于单独抽中一次a的后验概率。)更多的练习可见于章后习题1和2(提示见书后附录A)。

5.4 实验结果

没有人会想到,像信念形成这样充满噪声的东西会严格遵循一个数学公式,然而,实验的目的就是要揭示系统性这个偏差的本质。前文有关疾病的例子表明,人们在某些情况下可能会低估基于基础概率的先验信息。

这种基础概率偏向(base rate bias)是卡尼曼和特沃斯基(1973)报告的一些实验背后的诱因,他们给实验对象列出了一些对律师或工程师的简要描述。被试被告知,这些描述是从70%的律师和30%的工程师中随机挑选出来的。被试被要求报告描述与律师有关的可能性的百分比。第二组被提供了一些相同的描述,但这些描述是从一个包含30%律师和70%工程师的样本中挑选出来的信息。被试对那些明显描述了一种或另一种职业的描述不存在疑问。一些描述故意保持中立,比如“他很有动力”,或者“他会在事业上成功”。尽管原始样本被认为包含70%的工程师,但这种中性描述的语气响应涉及近一半的概率。这种观察到的行为对每个职业比例的先验信息不敏感,这是一种基础概率偏向。请注意,同样的基础概率偏向也出现在本章开头的问题中,在基础概率信息中,1000人中只有1人患有这种疾病,然而,通常情况下,在检测结果呈阳性后评估患病的机会时,并没有充分考虑这些因素。

Grether(1980)指出了卡尼曼和特沃斯基实验中潜在的程序性问题。在某种程度上,这些虚构的描述存在欺骗性(deception)。此外,还有一个激励(incentive)问题:即便人们能够“被带入”情境,他们也没有外在动机来仔细思考这个问题。此外,文字描述中的信息很难在贝叶斯公式中找到对应要素,进而展开评价。换句话说,给定职业比例并结合特定的描述,也很难给出理论的预期概率。Grether在自己的实验中采用bingo盒子 和双对象(object)设计。他在实验中研究的心理偏向为代表性偏向(representativeness bias)。在之前的两只杯子案例中,3次抽取的样本里若包含2个黄球和1个蓝球,恰好与A杯中小球的比例相等;如此,该样本便看似“代表”了A杯。我们看到,在这样的样本之后,A杯的概率应该是2/3,而报告有更高概率的人,比如80%,可能是因为代表性偏向。

注意,2次黄球和1次蓝球的样本的确意味着A杯的可能性更高。如果提问哪一只杯子被选中的可能性更大,即便被试回答A杯,也无法辨别其究竟是出于贝叶斯行为还是代表性偏向,因为两者都会导致被试倾向A杯。于是,Grether采用了不对称的设计,降低贝叶斯预测的A杯概率,从而巧妙地回避了上述问题。通过这种方式,2个黄球和1个蓝球的样本仍然“代表”A杯,但如果设置中A杯的先验概率足够小,那么A杯的贝叶斯概率就会小于1/2。因此,当被问及哪个杯子更有可能时,代表性和贝叶斯规则会有不同的预测。

关于哪个杯子更有可能的二元选择问题更容易提供激励:只要被试猜中了实际选取的杯子,便将得到一笔现金报酬。Grether便使用此程序:若预测正确,被试得到15美元,反之仅得5美元。当代表性和贝叶斯计算表明相同的答案时,受试者倾向于在80%的情况下给出正确答案(根据具体样本的不同会有一些变化)。当代表性和贝叶斯规则得出不同的答案时,这一比例下降到60%左右。

如果基础概率很低,并且像前一章所讨论的那样,一个人倾向于概率加权,那么低的基础概率就会被高估,也就是说,被认为高于贝叶斯规则确定的实际概率。当然,非线性概率加权也可能影响贝叶斯规则计算中使用的其他概率感知,例如,与某一特定事件的给定样本相关联的概率。简而言之:

信息方面的心理偏向(Informational Bias): 基础概率偏向是指一种忽略或低估有关总体均值或者“基础概率”的先验信息的倾向;而非线性的概率加权(反S形的加权函数)则可能导致较低的基础概率被高估。代表性偏向指的是,当样本看起来类似于(代表了)某一事件时,人们对该事件赋予过高概率的倾向,即便该事件的先验概率可能很低。

5.5 诱出概率的贝叶斯规则

在有些情况下,令被试直接给出事件发生概率,而非回答哪一事件发生的可能性更大,对开展研究大有裨益。比如,可以提问“A杯被选中的概率是百分之几”。而问题在于如何提供激励,使人们认真地考虑上述提问。Becker、DeGroot和Marschak(1964)开创了一种实用的方法(BDM方法),最初用于诱出被试的效用,而后亦被用于概率。被试常对BDM方法感到困惑,但其实该方法的基本思路非常简单:

假设你拜托朋友去买水果,他们会问你更喜欢苹果还是橘子(以防两者都有)。你将没有动机在你的偏好上撒谎,因为说实话可以让你的朋友为你做出最好的决定。

BDM方法要求被试报告某一事件以后发生或不发生“在100次中可能的次数”。该方法根据提交的概率为被试做出选择,其安排确保被试如实报告,以便做出最佳选择(从被试的角度)。有两种支付方式。使用“事件彩票”(event lottery),当该事件发生时得到奖励,比如10美元。或者,“骰子彩票”(dice lottery),有 N /100的概率获得10美元。如果事件在100次中可能的次数大于 N ,那么事件彩票对被试来说是更好的,如果这些可能的次数小于 N ,那么事件彩票对被试来说是更不利的。实验者本质上是站在去水果摊的朋友的立场上,这是可以解释的:

你应该如实报告你认为事件发生在100次中可能的次数,这样该方法就可以选择最适合你的选项:事件彩票或骰子彩票。具体的骰子彩票是事先不知道的; N 的实际值将由两次投掷10面骰子决定(在你报告之后),第一投决定十位数,第二投决定个位数。

要论证被试有动机实话实说,不妨反方向考虑。假设在被试的信念中,事件(比如,选中A杯)被认为发生的可能性为50/100,但却选择谎报为75/100。对于被试而言,事件彩票有一半的机会提供10美元。如果实验者然后掷出一个7和一个0,那么 N =70,骰子彩票将产生70%的机会得到10美元,这比根据被试的实际信念得出的50%的概率要好得多。但是,因为被试错误地报出A杯的概率是75/100,所以实验者就会拒绝骰子抽奖,而把被试的收入建立在A杯抽奖上,这使得中奖的概率降低了20%。我们可以用对称的观点来解释,为什么报告A杯的概率小于符合被试信念的概率,也是错误的(见章后习题3)。

因为BDM方法只需要比较10美元的货币收益的概率,而且总是倾向于更高的概率,这种方法不是基于任何关于风险厌恶或偏好的假设。回避风险厌恶问题是BDM方法的一大核心优势。但是,骰子和事件彩票的复杂性同样令人担忧。当研究人员需要概率的数值度量时,概率诱出是有用的,例如,要评估的是贝叶斯信息处理数值,而不是通过询问哪个事件更有可能而得到的定性数据。但是,相较于简单的二元选择,概率诱出更易引发混淆,可能包含更多“噪声”,从这个角度来说诱出过程也并不完美。

表5-1为一项应用BDM方法的实验中两名被试的诱出概率,实验的现金奖励为1.00美元,而不是10.00美元。A杯和B杯中小球仍同图5-1一样。实验共分三部分。第一部分主要是让被试熟悉相对复杂的实验流程;第二部分包含10轮实验,采用不对称概率(A杯被选中的概率为2/3);第三部分的另外10轮采用对称概率(A杯被选中的概率为1/2)。不同小组之间对称与不对称实验局的顺序相反。

表5-1 一项贝叶斯规则实验中两名被试的诱出概率

(续)

具体地,表中为被试1和被试2在第21~27轮得到的信息和决策,杯子的先验概率均为1/2。首先考虑左侧的被试1。第21轮,并未抽取小球,因此表中“抽取”一列A杯的贝叶斯概率为0.50。在“诱出概率”一列,第21轮被试的答案为0.49,和第26轮(抽中ab,相互抵消)相同。其余各轮的贝叶斯预测结果皆可用计数直觉推断法或者贝叶斯规则算出。例如,在第22轮,只抽中一次a球,由于A杯有两个杯中的3个a球中的2个,故A杯的贝叶斯概率为0.67。被试1给出的概率为0.65,相当准确。总体看来,被试1的预测准确得异乎寻常。与理论预测的最大偏差出现在第24轮,面对的样本是bab,被试给出的A杯概率为0.25,低于贝叶斯规则的预测值1/3。这体现了哪种心理偏向呢?

被试2预测的准确性则相对较低。面对ab和ba两个样本,两杯概率理应相等,但是被试2却分别在第23轮和第26轮给出0.60和0.30的答案。这些答案的平均值相差不大,但对于这样一个简单的推理任务来说,与样本中的其他答案相比,离散度是异常的大。被试2在单独抽中b(第22轮)和a(第25轮)时预测得相对准确;但是在面对由3个小球组成的样本时,却表现出“代表性偏向”。例如,在第27轮,aab的样本看起来像A杯,被试2的诱出概率为0.80,比实际概率0.67要高很多。

图5-4为22名被试在对称和非对称实验局的结果汇总。横轴为是A杯的贝叶斯概率,从左至右:在对称局(两只杯子的先验概率相等)样本为bbbb时仅为0.05;在非对称局(A杯的先验概率为2/3)样本为aaaa时达到0.97。被试的诱出概率位于纵轴。45度虚线代表贝叶斯预测;实线和灰色虚线分别为诱出概率的均值和中值(中位数)。

总体而言,被试很好地运用了贝叶斯规则。均值线(黑色实线)在左侧轻微地向下偏移,在右侧轻微地向上偏移,和前面章节讨论的非线性概率加权基本一致。或者,这些偏差可能是由于在左边向上的方向和右边向下的方向有更多的随机误差“空间”。这种基于误差的猜测是由于观察到中位数(粗虚线)通常更接近贝叶斯预测。举例来说,假设一名被试对实验感到困惑,慌乱之中,在抽出aa后给出A杯概率为0.01(实际的事后概率应为0.80)。在图的右边,在向下的方向上有更多的极端错误的空间。为了看到这一点,可以想象从图5-4的水平轴上的0.8点开始画一条垂直线。如果一头雾水的被试预测的概率基本均匀地分布于垂线上,更多的标记点将在45度虚线以下,因为下面有更多的空间。这种类型的随机错误将倾向于将平均报告的概率拉到图右侧45度线以下,而相反的效应(向上偏倚)会发生在左侧。相比中位数,平均值对极端误差更加敏感,这或许可以解释为什么平均值与45度虚线之间的偏差更大。

图5-4 诱出概率与贝叶斯预测

资料来源:Holt和Smith(2009)。

5.6 一个罕见事件的后续实验

前面的数据所涉及的先验概率在0.33~0.66,并且总体而言,当被试有机会做决策和学习时,贝叶斯规则提供了合理的预测。问题也随之而来,如果某事件的先验概率很低(比如本章开篇在介绍基础概率偏向时讨论的罕见疾病),被试的表现又会如何?为检验这一问题,可在实验中,将A杯的先验概率设为0.04,并且,这个“黄杯”里只有黄球a。平均来说,在100次试验中,应该有4次A杯被抽到,而且每次都是a,因为A杯只含有黄球。因此,在100次试验中,将会有4次真实阳性。这样,在100次试验中,平均抽到B杯96次。为了获得仅0.1的后验概率(和最初的疾病案例一样),假阳性和4个真阳性的比例应该是9比1,所以使用B杯的96次中有36次假阳性。因此,假阳性率设为36/96=3/8。也就是说,在将要讨论的实验中,从B杯抽出a球的概率设定为3/8。

实验的报酬和具体流程与上一节介绍的手工实验大致相同,仅借由计算机增加了实验轮数,且先验概率在全部三组20轮的决策中保持不变,避免了序列效应。此外,实验报酬从之前的1美元提高到2美元。与之前实验相同,被试会先看到抽取0/1/2/3/4次小球(放回抽样)的结果,然后再回答选中杯子为A的概率。以上BDM诱出过程可用Veconlab网站的贝叶斯规则程序实现。

A杯的后验概率由0(只要抽出b)到0.1(一次抽取,结果为a),最高达到0.68(4次抽取结果均为a,没有b)。图5-5为Veconlab给出的图形结果,包含24名被试在低先验概率实验局(每人完成60次决策)中诱出的概率均值与中值。虽然,诱出概率较贝叶斯预测存在向上偏移,且依然在均值(黑色实线)上表现得更加突出,但是,总体图形准确得出人意料。举例来说,假设抽中一次a,就意味着红球的后验概率为0.1(就和本章开篇的疾病案例一样,只是相较杯子和小球,罹患疾病的概率更低,使用的检验方法准确度更高)。从图5-5横轴上的0.1点垂直向上看,我们看到均值低于0.3,中位数(中值)略高于贝叶斯预测的0.1。

图5-5 一个小概率事件的诱出概率和贝叶斯预测

注:均值(带点黑线),中值(灰线)。

资料来源:Holt和Smith(2009)。

观测到诱出概率与贝叶斯预测的偏差时,研究者的一种反应是从贝叶斯计算出发,并对被试的行为模式建模。Grether(1992)和Goeree等人(2007)构建了一种广义的贝叶斯规则,将条件概率转换成 β 次幂的形式。以A和B两事件为例,样本s出现的概率表示为 β 次幂的形式,即式(5-4)的贝叶斯公式分子和分母上的Pr(s|A)和Pr(s|B)变为(Pr(s|A)) β 和(Pr(s|B)) β 。当 β =1时,广义的贝叶斯规则退化为贝叶斯规则。当 β <1时,公式会赋予先验概率“过高”的权重。例如, β =1/2,公式中将对条件概率取平方根,而分数的平方根大于原分数。(例如,(1/2)×(1/2)=1/4,所以1/4的平方根为1/2,大于1/4。)运用从社会学习(“信息级联”)实验中取得的数据,Goeree等人估算 β 值显著小于1。

Holt和Smith(2009)使用本节描述的所有实验局的数据来估计具有典型形状的概率加权函数(高估小概率,低估大概率)。该函数采用了卡尼曼和特沃斯基(1979)提出的函数形式,即第4章中式(4-1)的第一种形式。贝叶斯规则实验的参数估计结果显示, ω =0.713,标准误为0.024,与图4-1中构造概率加权曲线时的取值0.7基本相等。作者同样还估计出了基础概率偏向参数, β =1.027,但是和1并无显著差异。结合上一段的论述,这一参数估计值表示基础概率偏向不显著。总结如下:

贝叶斯规则实验结果: 在对称的1/2先验概率情况下,利用经济激励(BDM方法)诱出的概率往往能够较好地跟随贝叶斯规则预测。当一个事件的先验概率很低时,则存在向上的偏向。计量经济学分析表明,这种偏向是由于“通常的”(反S)概率加权造成的,它高估了低概率。

5.7 扩展

诱出的信念可能与贝叶斯规则的预测结果大相径庭,特别是在类似第一节讨论的疾病案例这种极端情形下。条件概率计算的数学指导可能不会有太大帮助,而且,这些技能很快就会被遗忘。反过来,以频率形式表述问题,进而运用计数直觉推断法,能够帮助人们在新环境下很好地估计概率(Gigerenzer and Hoffrage,1995,1998;Anderson and Holt,1996a)。

在下一章中将会讨论BDM方法的若干种替代,重点将集中在诱出过程中哪些因素造成了对贝叶斯预测的偏离。其中,使用最为广泛的一种方案——二次型得分规则(quadratic scoring rule),则需要风险中性假设或其他一些调整。

正如学术文献中提到的,情绪的影响或者说情感(affect)或许是一个难以模型化的偏向来源。Charness和Levin(2005)定义的情感效应(affect effect)是一种“赢则继续,输则求变”(win-stay,lose-switch)的直觉推断法则,这会导致贝叶斯规则下的最优选择“感觉像错了一样”。例如,假设一个岗位有两名销售人员可供派遣。其中一人这周没空,于是派遣了另一人且表现良好。于是在下一周,需要决定是继续派出此人(赢则继续),还是换成之前没空的那位。此时,“赢则继续”的策略未必最优:第一周的优异表现或许来自有利的市场环境,如果上周没空的销售人员更善于利用有利环境、增加销量,那么即便上周的业绩不错,换人仍然是最好的选择。他们在实验设计中构造了多种情况,令最优决策是在得到好结果后而做出改变,而在招致坏结果后保持策略不变(见章后习题第7题)。总体而言,大约有一半的被试违背了这一最优决策,转而往“赢则继续,输则求变”直觉推断法靠拢。其他有关违背贝叶斯规则的案例与研究,可见于Zizzo等人(2000),以及Ouwersloot、Nijkam和Rietveld(1998)的论文。

虽然贝叶斯规则的预测有系统的偏差,但没有一个被广泛接受的替代模型来说明信息在各种情况下是如何被实际处理的。目前,尽管经济学家对强化学习等非贝叶斯模型(将在第7章中讨论)有了一些新的兴趣,但是他们还是倾向于使用贝叶斯规则或参数化的泛化方法来推导预测。

第5章习题

1.沿用图5-1中两只杯子被选中的概率相等的设定,但是改变A杯和B杯的内容:现在A杯中装有3个黄球和1个蓝球(aaab),B杯中装有两种小球各2个(bbaa)。那么,当抽出一个b后,选中的是A杯的概率有多大呢?

2.设定同第1题,但是现在共抽取了两次小球(放回抽样),两种小球各一次(一个a一个b)。此时A杯的后验概率又是多少?

3.假设我们使用了第5.5节描述的BDM诱导方法,一名被试在观察到抽取结果后,认为A杯与B杯被选中的概率相等。证明,如果此人向实验者汇报A杯的可能性是25/100,将会对其不利。

4.21名弗吉尼亚大学生参与了一场贝叶斯规则课堂实验,实验只有7轮,报酬为现金形式(每人3~4美元)。每个杯子被用到的可能性是一样的,且实验告知被试有时间完成数学计算。抽取小球的结果和相对应的平均诱出概率如下表所示。

A杯的诱出概率——均值和中值(中位数)

(a)计算表中7种样本结果的贝叶斯后验概率。

(b)你如何总结对贝叶斯预测的偏离?是否有证据显示存在代表性偏向?

5.设想一名厨师制作了3张薄煎饼,第一张烤焦了一面,第二张两面都焦了,第三张恰到好处。这名厨师随机地选择一张煎饼,故三者被选中的概率相等;然后把煎饼高高抛起,两面中任何一面朝上的概率也相等。除了以上有关煎饼的信息外,你只看到盘中煎饼朝上的一面烤焦了。此时选中只烤焦一面的煎饼的概率有多少呢?请解释。

6.一名40岁的女士进行了乳腺癌检查,结果呈阳性。已知在这类妇女中,以前未确诊女性患病的概率是1‰。从某种意义上说,上述体检相当准确:如果女性患病,检验结果80%呈阳性。对于没有患癌症的女性来说,阳性的概率只有10%。如果检测结果是阳性,那么病人患癌症的概率是多少?(一项研究中,受访的德国内科医生里有超过90%的人回答错误,且他们普遍的答案与贝叶斯规则的标准答案之间的差距有10倍之大。)

7.考虑一位决策者,他有两种决略,一个是温和的,一个是极端的。最优策略取决于当前未知的世界“形势”——“好”或者“坏”,这二者是等可能的。把形势和策略的特殊组合想象成一个有6个球的杯子,H代表高收益,L代表低收益,如下表所示。对于任何给定的杯子,随机抽取一个球来决定收益。例如,如果做出了温和策略,而形势是好的,那么,获得高回报的概率是4/6。假设你被迫选择温和策略,第一轮的结果是H,第二轮(也是最后一轮)的形势与第一轮相同。形势为好的概率是多少?在第一轮获得H后,第二轮应该继续保持温和策略还是转向极端策略?请用贝叶斯规则做出解释。

8.表5-1中,被试1在第24轮是否表现出了代表性偏向? kqKaJcTga7pdsO5dm4M1XqM+YQ2kjUbN+NW/C3dfg2HpPkUq95otVpUhCOlWLqwS

点击中间区域
呼出菜单
上一章
目录
下一章
×