决策情境可以分为三个部分:(1)可能的行动;(2)所处世界可能发生的事件或可能的状态;(3)在每种可能的外界状态下,对不同行为产生的结果进行评估。由于未来的世界几乎总会有多种可能的状态存在,我们不知道哪种情况会发生,无法判断行动的结果,因而任何一种行动都可看作一种结果未知的赌博。从这个角度来看,生活本身就是一场赌博(因为无法准确知道未来世界的状况,我们不能够准确预知结果)。正因为如此,认知科学家经常通过研究实际的赌博行为,来探究人们是如何进行决策以及面对风险的。
考虑以下两种赌博方式:
赌博方式A :从一副扑克中抽牌,如果抽出红色牌就赢得10美元,抽出黑色牌就输掉6美元。
赌博方式B: 从一副扑克中抽牌,如果抽出红桃牌就赢得20美元,没有抽出红桃牌就输掉2美元。
赌博方式A可以如下表示:
同样,赌博方式B也可以如下表示:
假设我们面临的决策是选择赌博方式A还是赌博方式B,不能够放弃参与,在这两种行动间必须做一选择。这里要使用到的原则就是选择有最高期望值的行动。但是,在目前的情况下我们还无法计算,因为还未确定每种未来状况发生的可能性大小。如果我们已经知道共有52张扑克牌,一半花色是红色,一半是黑色,并且花色有四组(方片、梅花、黑桃、红桃),每组13张,就可以很容易地计算出相应情境发生的概率了。从中抽出红色牌的概率是0.5,红桃牌的概率是0.25(不是红桃牌的概率为0.75)。两种选择的信息可以更完整地表示如下:
最大化期望值的原则,要求一个理性的个体选择期望值最大的行动。期望值的计算需要把每种结果带来的价值乘以其发生的概率,然后把每种结果下的乘积加总得到。它用符号表示的计算公式如下
期望值=Σp i v i
式中,p i 是每种结果出现的概率;v i 是每种结果产生的价值;Σ是表示求和的运算符号。将Σ后的数值符号进行加总
赌博方式A的期望值=0.5×(10)+0.5×(–6)=5+(–3)=2(美元)
赌博方式B的期望值=0.25×(20)+0.75×(–2)=5+(–1.5)=3.50(美元)
因此基于期望值原则,选择赌博方式B是更好的行动。当然,并不能保证赌博方式B在每种情境下都比赌博方式A好,但是在大多数情况下,如果采取这个选择,长期来看,赌博方式B每种情境都会比赌博方式A多赢得1.5美元。
然而,金钱上的价值和效用并不能等同。我们很容易就可以举出人们不愿完全依据最大化期望值进行选择的例子。例如,雷斯尼克(Resnik,1987)就讨论了下面这个例子:假设你花了4年的时间存够了1万美元,这将是你用来支付房子首付的钱。在你要买房子的两个月前,有人向你推荐了一个投资机会。只要把1万美元都投进去,一个月后你会有80%的概率得到10万美元的报酬,但也有20%的概率损失全部1万美元。虽然这个赌博有8万美元的期望收益,并且只需投入1万美元,但对你来说可能并无吸引力。这里金钱上的价值就不能直接转化成线性增加的效用。因为对你来说,0~1万美元效用的差异要远远大过1万~10万美元效用的差异,即便是单纯从数值上来看并不是如此。
而在另外一些特殊情况下,事情可能又会朝相反的方向发展。假设你欠某个组织1万美元高利贷,必须在两个小时内还清,否则会被对方打断双腿。你只有8000美元,有人向你提供一个赌博机会,需要你花全部8000美元参与。规则是投掷硬币,如果正面朝上你可以获得1万美元,反面朝上你就什么也得不到。你可能反而会觉得这个赌博对你很有吸引力,即使你需要花8000美元参与,而它的期望收益只有5000美元。这一差别的原因就是,你目前所处的这种特殊情境,让你觉得8000~10000美元的效用远远大于0~8000美元的效用,即使这也与数值所反映的情况明显不同。
另外,除去这些特殊情境,随着个体财富量的增加,增加某一数值金钱所带来的效用通常也会逐渐递减。早在1738年,数学家丹尼尔·伯努利(Daniel Bernoulli)就发现,对于净收益100万美元的个体而言,增加100美元的效用要远远低于净收益只有1000美元的个体。或者,正如伯努利(1738,1954)当时所说,“获得1000金币对乞丐的重要性远远高于对一个富人,即使两人都获得了相等数量的收益”。
以上这些例子想要表达的观点就是,期望值并不等同于我们真正想要计算的量:期望效用。因而,为了获得更大的适用性,期望值模型需要被期望效用模型所取代。在抽奖中赢得一次独木舟旅行机会对个体真正的价值,是通过它的消费效用而非金钱价值来衡量的。例如,对于怕水的人,这个奖励的主观效用可能反而为负。
在如下的情况中,采用期望效用模型可以让我们做出理性选择:假设明天你和家人有两种活动可供选择,参观现代美术博物馆或者去沙滩游玩,但不能都去。大家的首选都是沙滩,但天气预报说,明天可能会下雨。如果下雨就没法继续在沙滩玩,而你们也来不及再从沙滩赶回博物馆参观。如果天气好的话,去博物馆显然不如去沙滩,但如果是雨天,去博物馆又明显优于去沙滩。是否下雨对参观博物馆的影响并不大,只是如果下雨就不能参观里面的一个雕塑花园。因此,基于行动、未来状况和结果的决策情境可以表示如下:
当然,要想对这种情境进行更规范的期望效用分析,就需要这四种可能情况分别的效用估计值,以及明天下雨的具体概率值。在上一个赌博情境中,我们通过扑克牌的构成情况知道了每种未来状况的发生概率。而在这个情境中,决策者并未被告知明天下雨的具体概率,而是需要决策者自己进行估计。事实上,在日常生活的大多数情境中,我们都不知晓事件发生的具体概率,只能依靠决策者的主观估计。
让我们假定决策者估计出下雨的概率是0.2,估计的效用值如下表所示。注意我们采用的都是相对性数值来表示效用,如果给每个数字除以10的话,计算得到的决策结果也不会改变。
现在我们可以使用同之前类似的最大化期望公式来进行计算,只是金钱数值被效用所替代,指定的概率被主观估测的概率所替代
主观期望效用(SEU)=Σp i u i
式中,p i 是每种结果出现的主观估计概率;u i 是每种结果带来的效用。
对于去沙滩的行动,SEU=0.80×100+0.20×10=80+2=82
对于去博物馆的行动,SEU=0.80×60+0.20×50=48+10=58
因而,基于SEU分析,最大化期望效用的行动是去沙滩。以上就是理论上SEU的整个分析过程。基于SEU对个体概率和效用估计值的分析得出的正确行动选择,会与个体实际做出的行动进行比较,理性即通过这两者的近似度来表示。在实践中,通过这种方式来评定决策者的理性并不容易,因为要得出个体的各种概率值比较困难。并且,要测量出每种结果的效用在实验中也是较难操作的。