我们常常听到这种抱怨:“特意收集数据,做了种种表格,却被人指责道‘你到底要说什么?’”“就算看了别人的图表,却不知道该如何解读。”“我就是觉得数字很棘手,很讨厌。”确实,很多人苦恼于不知道如何使用数字进行分析以及如何与数字打交道。
在第一章中,我们一起来思考分析原本的目的是什么、分析以何务为中心。
Let’s do the numbers!(让我们来处理数字吧!)
各位喜欢数字吗?擅长运用数字吗?
不知什么原因,商学院很喜欢用2×2的矩阵归纳各种现象,那笔者就用矩阵归纳一下各位现在的状态。两条轴线如下图所示,纵轴代表“喜欢 讨厌”,而横轴代表“擅长 棘手”。根据自我评估,您是处在A、B、C和D四个象限中的哪一个呢?
图1.1 数字乐园:迷宫矩阵(一)
笔者在讲课或者办企业研修班时,一开始的时候一定会要求学员做笔者在讲课或者办企业研修班时,一开始的时候一定会要求学员做这种自我评估。通常的情况总是,其中大约六成的人处在A象限,对数字“喜欢但觉得棘手”;另有将近三成的人处在C象限,对数字“讨厌又觉得棘手”;剩下的少数人则处在B象限或者D象限,对数字“喜欢又擅长”或者“讨厌却擅长”。
图1.2 数字乐园:迷宫矩阵(二)
喜恶暂且不论,大多数人似乎认为数字很“棘手”,觉得擅长的人是极少数(或许正因为如此,笔者的课程才开得下去)。
图1.3 数字乐园:迷宫矩阵(三)
本书的目标是尽量把各位从目前所在的位置,引导到“数字乐园”所在的“喜欢且擅长”象限。乍一看可能会觉得很难,不过要实现“棘手→擅长”,只需要一点和数字打交道的窍门。另外,为了达到“讨厌→喜欢”的过渡,我希望能和大家共同体会运用数字的喜悦和乐趣。期盼各位一边尽量接触由数字引发的趣味实例,一边学习和数字打交道的方法。
拿起本书的读者,想必多是能在商务中使用数字或是强烈地感受到使用数字的必要性的人吧。毋宁说,在工作中完全不使用数字,也许更难吧。
也许对这样的人来说,数字的重要性是不言自明的,但在这里我们还是要再次思考,对经营而言,数字究竟具有怎样的意义。
关于这一点,看看实际经营的专家――企业家是如何谈论数字的,或许是最快的捷径 。
“会计数字就像飞机驾驶座上的仪表。假如没有反映真实的状态,就不能向正确的方向操纵。”(稻盛和夫,京瓷创始人、日本航空会长)
“对话中不包含正确的时间、金额以及其他数字,就不是在谈生意。这不过是侃大山。”(似岛昭雄,宜得利社长)
“凡是问题,必有原因。还有,数字是不会撒谎的。只要根据原因和数字来对照实际,就一定会找出对策。”(泽田秀雄,日本HIS国际旅行社会长)
“会议的绝大部分时间都被用于数字的报告上。之所以用这种风格开会,是因为数字本身就会说话。”(小山升,武藏野总经理兼社长)
“没有数字的故事和没有故事的数字,都没有意义。”(御手洗富士夫,佳能会长)
在上述关于数字的名言中,我在课堂上最常引用的是御手洗先生的话。原因在于,我认为这句话用不能更短的语句极为准确地把握了数字对于经营的意义。
御手洗先生在接受杂志采访之际,说了如下一段话:“用数字把目标呈现出来之后,为实现该数字需要做什么?应如何去做?让谁用怎样的方法去做何种工作?要实现这种工作,哪种情景是必要的?以上种种作为方法论的故事就会浮现出来。……没有数字的故事和没有故事的数字都没有任何意义,既不能实行,也无法达成。通过展示数字和能够保证实现该数字的故事,就会增强经营计划的可靠性,并确保市场和股东的信任。数字力会赋予言语以信赖的力量。”
图1.4 分析最大的关键
经营、商务是为达成目的(比如说赚钱)而进行的开发、制造和销售产品和服务的一系列活动,为此必须弄清如何行事才能将行为导向结果。经营者需要“做这件事(手段)就会变成这样(结果)”的因果故事,这个故事有时会以“计划”“战略”以及其他种种词汇来形容。要是没有这样因果关系分明的故事,就会变成只有天知道行动是否能够奏效的“魔咒”。
经营公司必须要有故事。尽管如此,另一方面,如果没有做什么、做到何时和做到何种程度这样的具体性,故事最终就难免成为镜花水月。借用似岛氏的话来说,那就只是“儿戏”。赋予故事以具体内容、赋予故事以是否能够顺利进展的判断标准者,就是数字。或许把数字视为故事和现实的接点并无不妥。
下面就从“假说思考”和“分析”的角度,来探讨对经营而言必须有的故事和数字这两个方面。
谈到使用数字的分析,人们往往不难想到高中或大学里晦涩难解的“统计”和复杂的Excel操作,但实际上其观念和角度从本质上来说相当简单。
借用爱因斯坦的话来说,就是:“假如你无法简单地说明,就意味着你了解得不够透彻。”(“If you can’t explain it simply, you don’t understand it well enough.”)
这里要和大家一起做一个简单的分析。
“爱价几何?”
要用什么样的数据和图表,才能回答这个问题呢?
尽管有种种不同的爱,但这里先专心思考容易设想的男女之爱。
假如在商学院以演习的形式进行专题讨论的话,就会有种种想法。比如把送给对方的礼物和约会花费的时间换算成金钱相加,或是从寿险和离婚时的赡养费推导出结论。乍看之下似乎很简单,但在有真爱时寿险的保额会比较高吗,搞不好没有爱时才会比较高。
虽然也有人认为爱本无价,不能换算成金钱,但这里要介绍个有趣的分析案例。
就如表1.1所示,安盛人寿进行了一项调查,以职业单身女性(25―44岁)为调查对象,询问她们期望男性有多少年收入,结果发现理想的平均年收入为552万日元。与此数额相对,在被问及“假如出现一个自己爱慕的对象,那名男性的年收入最低可以降到多低,你也愿意和他结婚”时,年收入则为270万日元。两者的差额约为282万日元,这里可以把它解释为爱在一年中的价格。
这个分析堪称巧妙,它不直接问爱价几何,而是从听到的回答中间接地试算爱的价格。
表1.1 职业单身女性(25—44岁)对男性年收入(单位:万日元)的期望值
出处:安盛人寿保险《成年女性风险实况调查》2010年2月。
在试算爱的价格的例子中,将真爱跟感觉不到爱的回答“比较”之后,就能从差额当中顺利推导出爱的价格。实际上,大家每天进行的使用数字的分析,其本质在于“比较”。即使说“没有不进行比较的分析”,也不能算言过其实。
通过比较,从数字这块“原石”中“提炼”出意义就是分析。大家平时所作的分析,其多数也是在无意识之中进行了某种比较。仅仅意识到在比较什么、比较对象为何,分析就会变得异常敏锐。
那么,为什么要进行比较呢?
为了回答这个问题,就有必要追溯在商务活动中究竟是为什么要进行分析。
在被问及“商务活动的本质为何”之际,我的回答可谓一言以蔽之,“构筑因果关系”。之所以这样说,是因为,在商务活动中,通常会期待成果或目的,而为了予以实现,就要采取诸多行动或行为。当此之际,人们每天就会殚思极虑,采取何种行为更有效率,而且能有效达成成果。
为了通过行为产生期待的成果,行为和期待的成果之间的因果关系就必不可少。假如采取了因果关系不明确的行为,行为的水准就几乎跟“念咒”别无二致。
如果换一种说法来表述的话,或许可以说“明了因果关系,就可改变未来”。大家不就是为了改变未来而工作的吗,应该会想要改变未来吧。
即使我们斩钉截铁地说,一句话,“构筑因果关系就是一切”,也难以给人以“这就是分析”的印象,还是来点具体的,把解决问题作为例子来思考。大家在工作中处理的内容,我想在宽泛的意义上大多可以归结为解决问题。谈到解决问题,大家或许会觉得“每天的工作没有那么多的问题要解决”。
图1.5 解决问题
这里首先有必要思考,问题究竟是什么。常用的实用定义如图1.5所示,其做法是把现状和应有之姿(目标)之间有差距的状态作为问题来把握。这样思考的话,例如计算机无法开机(应有之姿:启动状态;现状:无法开机、不能启动)的状态也可以称为问题。
另一方面,把应有之姿当成目标来把握又会如何呢。大家工作的绝大部分内容就是面向目标采取某种行动。目标和现状之间有差距,可以说是有问题的状态。如果目标和现状一开始就别无二致,那就没有必要采取任何行动了吧。我们可以把为达成目标而采取行动理解为消除目标与现状的差距,也就是解决问题。
后面我们将谈到的解决问题,和计算机无法开机这个浅显的例子的不同之处在于这一点,那就是设定应有之姿之后问题才产生。领导的重要作用之一就在于设定目标,如果套用我们对问题的定义来思考的话,也许可以说通过设定目标这一应有之姿来“制造问题”就是领导的作用。
这样,为了解决问题,掌握因果关系、采取某种行动来消除差距就变得必要。
因为解决问题正是要解决因果关系本身,所以我们在这里使用商使用商务活动中解决问题时经常使用的、通用性强的提问框架What→Where→Why→How作为具体思考因果关系的示例,来试着稍微思考一下,如表1.2所示(关于这个框架,在第二章再详加说明)。
①What:该解决的问题(应有之姿与现实的差距)究竟是什么?
②Where:问题出在哪里?
③Why:为什么会出问题?
④How:解决方案是什么?
在这四个问题之中,要回答前三个问题,“比较”必不可少。
首先,在明了问题点所在的What之中,通常以应有之姿与现状之间的差距来定义问题,这正是比较啊。其次,为回答锁定问题和对象的Where,以及阐明原因的Why,“比较”也必不可少。
表1.2 解决问题与比较
和其他部分比较之后,方能发现问题所在。另外,通过比较原因和结果来观察关联性,才能发现问题之因。
比如说,你在超市担任新商品(使用有机食材的高级盒饭)的销售策划人员,这时候你就应该思考锁定哪些客人为目标客户(Where),还有盒饭的包装要如何吸引客户才能畅销(Why & How)。
首先,我们要设想目标客户(Where)。这时必须思考对有机食材盒饭感兴趣和有反应的人属于哪个社会阶层。比如说,从消费者对问卷调查的回答中,得知家有幼童的主妇客户对此反应极为敏感。这个过程正是对主妇和其他客户关心有机食材程度高低的比较。
在此基础上,我们还要思考在哪一点上打动这个家有幼童的主妇客户才能更有销路(Why & How)。
回顾当初推出考究食材的盒饭之际,有没有将生产者的肖像印在包装上,销售额就有天壤之别。或许是因为印上了肖像就比较有亲切感,销量就像坐了火箭似的。考虑到将肖像印在包装上也一定会热卖,于是就如法炮制。这正是从肖像的有无与销售额的比较当中,衡量两者的因果关系。
在探索因果关系之际,大脑是如何思考的,我们要以数据为基础稍微设想一下。
每年一到冬天,感冒和流感就会流行。每到此时,我必然喉咙痛并且流鼻涕。但是有一年,也只有那一年,别说是流感,就是感冒我也没得。于是我就想,为什么呢?原因是什么呢?今年有什么和往年不一样的地方呢?
后来我猜想原因多半在酸奶上。今年我爱上了某家超市的酸奶,入冬以后就几乎天天在喝。于是我就想到,可能是酸奶中的乳酸菌增强了我身体的免疫力,所以没得感冒。
虽然真正的原因是否在于酸奶提升了免疫力不得而知,不过这种思考模式是推论因果关系的典型做法。也就是说,通过比较结果的不同、原因和期望之间的差异,建立起因果关系的关联。
我们再通过其他的例子来思考一下。
近年来,有研究指出反思在学习上的重要性 。例如,将学生分为经过反思的反思组和没有经过反思的普通组,两组成员测验的平均分数如表1.3所示。普通组的分数是66,而反思组的分数则高出15分(除了是否反思以外,其他条件都相同)。
大家看得出反思和测验结果有什么关系吗?比较有没有反思和测验结果的差异,就能判断出两者之间有因果关系了吧。也就是说,可以认为进行反思有助于测验结果的提高。顺便说一句,这个数据引自实际的研究结果 。假如反思之后就能提高22%的成绩,就没有人会不反思了。
表1.3 反思的效果
“反思”这个案例当中的原因在于定性类的有没有“反思”,接下来我们来探讨一下,要是原因出在数量时会怎样呢?表1.4是商学院学生持续记录生活时间,将每一季实际的学习时间和各学期成绩的关系用图表表现的结果。从学习量和成绩的比较当中,我们可以判明,用功时间愈多,成绩就愈好。从这层关联性(共变或相关关系)中能够看出一种因果关系,那就是学习量会影响测验结果,用功愈勤,则测验结果愈好。
表1.4 学习量的效果
出处:顾彼思商学院毕业生野吕浩良记录自己如何运用时间的分析数据。
从以上两个例子可知,要将原因与期望的有无,或者与期望值的大小乃至与结果的关联性进行比较,从差异当中评定是否存在因果关系及其效用。将这种比较关系稍微改写成方程式就如下面所示:
我们可以认为,也许从远古时代开始,人类为了生存下去,就在无意识之中掌握了这种思考形式。之所以这样说,是因为在课堂上对这样的数据进行解释之时,几乎所有的人都能推论因果关系,但是不能说明为何要这样推论的人却为数众多。
也许正是因为掌握了这样推论因果关系的思考形式,人类才在动物界脱颖而出,成为唯一创造出高度文明的物种。
到目前为止,笔者都使用“推估因果关系”这一表述方式。之所以这样表述,是因为如此便可以给我们“这样的关系也许是因果关系”的重大暗示,是因为这样的关系未必限于因果关系(关于因果关系成立的必要条件,在第四章会加以说明)。
最好的例子就是图1.6所示的厄运。比方说,如果你是销售员,有一天跑业务时偶然戴了红领带,结果就顺利成交了。当时你就会想,之所以产生和平时不同的结果,差异就在于红领带。所以你或许会认为,红领带是制胜关键,以后有重要谈判的日子,一定打着红领带赴约。
图1.6 红领带和因果关系
的确有些人称红领带为“权力领带”,认为它是强力和激情的象征。实际上,欧美的政治家和经营者打着红领带是一种司空见惯的现象。因此,不能完全排除红领带对客户的心理状态带来正面影响的可能性,但我们在此来试着考虑一下其他的可能性。
说不定差异除了体现在领带的颜色上,还体现在你进行营销活动的做法和客户方面。比方说,或许是因为客户相当重要,你做出来的提案比平时更为周详,至于选了和平常不同的红领带,只不过是为了换换心情而已。在这种情况下,与其说是红领带对成交产生了影响,不如说是精心准备的周详提案才是成交的原因。
推估因果关系的思考模式就这样铭刻在所有人的脑中。然而,问题在于人们平时使用这种思考模式是无意识的,所以一旦要尝试分析时,就无法运用自如。想要妥善分析,关键就在于在此过程中要意识到“用比较来掌握因果关系”的思考模式。
有句话说:“幸运女神的后脑勺不长头发。”指的是机会溜走之后会后悔莫及,别让机会逃掉,悔不当初。附带一提,在很长一段时间里,我无法想象只有刘海的女神是什么样子,这是何等模样的女神呢?其实原本希腊神话中的机会之神卡伊洛斯(Kairos)并非女神,而是一名少年。由于他的头发长在前额,等于只有刘海,因此机会一来就只能抓住那撮头发。
既然前面谈到“爱”价几何,现在就稍微偏离正题,一起想想该采取什么策略,才能在恋爱时邂逅命中注定之人以免抱憾终身。当然,只要和各式各样多不胜数的人交往就行了,但实际上很多人能够交往的对象人数有限。在此状况之下,该与多少对象邂逅再从中选择“心中的那个他(她)”呢?假如放掉这个人再找下一个,不就能遇到更适合自己的对象吗?不过,或许以后不会出现比这更好的人,这种令人烦恼的状况似乎也是存在的。
其实这种情况可以用简单的算式计算其概率。设定只要在遇到第几个对象(假设为r)之后选择这个人,就能邂逅命中注定的人(你心目中评价最高的人)。先说结论,如果一个人一辈子跟10个人交往,以这个算式计算其概率之后,就会发现r=4时概率最大。
换句话说,为了将邂逅命中注定对象的概率最大化,哪怕刚开始的3个(即4-1)对象是多么好的人,可能也要对他(她)们说“抱歉”。而要是遇到第四位以及其后的人,只要比刚开始的3人还要好,就选择那个人,这便是最好的策略。
另外,假如一生当中交往的人数n愈来愈大,就会发现最适合将概率最大化的r会逼近于n/e(只不过,e是自然对数的底数,约为2.71,因此1/e约为0.368),也就是该对这辈子刚开始36.8%的交往对象说“抱歉”,或是再简单一点,拒绝刚开始大约三分之一的人。
要说人类实际上会怎么行动,那就是往往等不到最恰当的人数就做出决策。或许不断分手的确是太难受了。
* * *
接下来要对感兴趣的人说明一下,这种算式究竟为什么可以计算概率。没兴趣的人烦请跳过。
概率的算式就如以下所示:
这里的n是你这辈子交往的对象人数。
另外,如果你交往时是采取以下的策略:对刚开始的(r-1)个对象说“抱歉”,假如第r人之后的交往对象比刚开始甩掉的(r-1)个人还要好,就当场选择那个人。还有,时光无法回头,就算能够找到下一个对象,已经甩掉的人也不会回来。这真会叫人悔不当初。
虽然令人念念不忘的(?)∑(读作sigma)出现在算式中的瞬间足以把人差点吓死,不过该符号指的是将某个范围的数值全部相加,就如下面所示:
如果命中注定的对象是M,当你的策略确立之后,就不断拒绝刚开始的(r-1)人,第r人以后,要是出现的对象比刚开始的(r-1)人还要好,就选择那个人。运用这个策略邂逅M的概率是P(r),这是将以下个别情况的概率相加的结果。
●第r人是M,而且直到第r人为止中途不选择对象,终获良缘的概率。
●第(r+1)人是M,而且直到第(r+1)人为止中途不选择对象,终获良缘的概率。
●······
●第(n-1)人是M,而且直到第(n-1)人为止中途不选择对象,终获良缘的概率。
●第n人是M君,而且直到第n人为止中途不选择对象,终获良缘的概率。
个别的概率当中,所有的候选对象为n人,因此第i人是M的概率为1/n。反观直到第i人为止中途不选择对象,终获良缘的概率,则可照以下方式计算。
要等到第i人后终获良缘,就必须在那之前不做选择。到第i人为止的i名对象当中,最好的是M。现在让我们想一想你邂逅的i名对象当中,第几个对象是继M之后第二好的人(姑且称为N)。之所以提到这点,是因为N是第几个遇到的对象,将会左右与M相逢的命运。这里要分两种情况进行考察:
●假如N君在第(r-1)人之前
●假如N君在第r人到第(i-1)之间
假如对第(r-1)之前的人说“抱歉”的过程中N就在,就代表第r人以后没有超越N的人,所以要在遇到第i人M之后,再选择M。
反观N出现在第r人到第(i-1)之间时,由于在遇到M的瞬间,N是当时最好的对象,所以至少在遇到M之前(或是在遇到M以外的第r-1人之前,就碰到更好的对象)就会选择N,等不到M出现。因此,假如想遇到第i人M,邂逅时继之后第二好的N,就必须在刚开始的(r-1)人当中。我们可以算出第二好的N,出现在刚开始的第(i-1)人到第(r-1)人的可能性为(r-1)/(i-1)。
总而言之,第i人是M,而且直到第i人为止中途不选择对象,终获良缘的概率是:
r 。
假如算这个概率时,将i通过∑从r相加到n,就会化为最开头的算式。
附带一提,这条恋爱方程式是为了将邂逅最佳对象的概率最大化而设想的策略,但实际上还有一条策略,是不强求必须邂逅最好的对象,第二好或第三好的人也不错,将结婚对象的期望值(expected value)最大化(找出平衡点邂逅好对象)。
这时最佳的策略跟之前的策略(要对刚开始约三分之一的人说“抱歉”)着实不同。研究人员发现,在这种情况之下,最适合的策略是,假设一生中能够交往的人数为n,再对刚开始的n-1人说抱歉,之后要是遇到的人比拒绝过的对象更好,就毫不犹豫地选择对方,这才是最好的策略比方说,假设这辈子能够交往的对象有10人,答案就是10-1等于2.16,要向刚开始的两人说抱歉,第三人之后要是出现的对象比刚开始的两人还要好,就选择对方。跟开头的策略把目标放在先邂逅最佳对象再说相比,还是稍微早一点决定比较好。
前面谈到,采取把目标放在邂逅最佳对象的策略时,人类实际的行动往往是等不到最恰当的人数就做出决策,但是人类实际的行动与其说是把目标放在邂逅最佳对象,倒不如说是采取找出平衡点尽量遇到好对象的策略,这或许比较接近实际的情况。
虽然分析就是比较,但人类是一种不仅止于分析、凡事都要比较才肯罢休的动物。比方说,就连自己是否感到幸福,也往往会忍不住要跟别人比较一番。
关于比较与幸福感,有一项饶有趣味的研究。
大家觉得奥运奖牌得主当中,拿到银牌幸福还是拿到铜牌幸福?客观来说应该是奖牌名次高的银牌得奖者会比较幸福,实际上却并非如此。
康奈尔大学(Cornell University)的维多利亚·梅德维克(Victoria Medvec)教授等人,曾经试着比较1992年巴塞罗那奥运会的银牌和铜牌得主 。研究方法是由(对运动没兴趣的)大学生从竞赛后不久开始的尤其是颁奖典礼的录像的情况,以10个等级估算得奖者的名次多高才幸福。
结果发现,以10个等级(1表示苦闷,10表示高兴,数字愈大表示愈幸福)评分法算起,竞赛后不久的铜牌得主为7.1,银牌得主则为4.8。而颁奖典礼上的铜牌得主为5.7,银牌得主则为4.3,铜牌得主的幸福感比银牌得主还要高。
会出现这种现象的原因在于比较对象的不同。也就是说,铜牌得主是跟没拿到奖牌的人(或是也许拿不到奖的自己)比较,感到庆幸。反观银牌得主则是跟金牌得主(或是差一步也许就能夺金的自己)比较,所以无法充分感受获得银牌的喜悦。
虽然分析就是比较,不过为了幸福着想,或许人生不要比较会更美好。
我们已经看到分析的本质在于比较。确实“分析就是比较”没错,但不代表每件事都该比较。(知道应该)拿什么跟什么比较,其实是相当重要的。
表1.5是美国某家顾问公司网站上的图表,以及这张图表所透露的信息。“本公司客户的股价提升到市场平均的3倍。提升客户的企业价值(=股价)是我们的工作。”
企业是谁的?企业价值是什么?虽然观点众说纷纭,不过这里则要从非常金融的角度,简单设想股价的水平就代表企业的价值。标准普尔500指数(S & P 500,Standard & Poor’s 500,简称标普500指数)是美国代表性的股价指数,以日本来说就类似于日经平均指数或东京证券交易所股价指数(TOPIX,Tokyo Stock Price Index)。
从这张图表的数据(与标准普尔500指数相比)来看,似乎表示经过顾问公司华丽的(?) 咨询服务之后,股价就上涨至标准普尔500指数的3倍(2倍的差距是拜顾问公司之赐)。假如顾问公司的作用没有图表显示的那样大,我们该注意哪一点呢?
首先,这家顾问公司正是要借由这张图表,传达“咨询服务→从结果来看企业价值(股价)提升”的因果关系。这项因果关系是否能由这张图表证明,是否具备足够的说服力呢?
表1.5 本公司客户股价与标准普尔500指数(S & P 500)的演进
在进行专题讨论之际,常会有人提出以下疑点:
●是不是专挑原本股价就上涨的客户?
→在此假设市场占有率没有那种作假的情况。
●当作数据的客户数量是不是原本就很少?
→的确要是数据太少,就有偏狭之嫌,不过这里的数量很充足。比方说有一百家公司以上。
●不晓得咨询服务究竟从什么时候开始,在什么时候结束。
→原因和结果之间的时间差距太久,接受度也不大。在此假设这段时间一直接受咨询。
●虽然取平均值,但是否有鹤立鸡群的企业股价涨为百倍,哪怕只有一家?
→假如有庞大的异常值(outlier),平均值就不一定适合代表全体,落入“平均的陷阱”当中。在此假设没有庞大的异常值。
●因果关系可以逆推吗?难道不是原本成长性就高的企业在接受咨询服务吗?
→确实单凭图表不晓得因果关系的趋势。在此简单假设挑选客户的方法并非精挑细选。
●客户实例是否过于偏向IT企业?网络泡沫化时期股价正在大幅上涨。
这里我们要特别聚焦最后一点再一起想一想。的确,从1999年到2000年这段时期股价急遽上升,客户类型或许会偏向IT企业。
既然如此,这张图表有哪里不对劲?经常得到的回答是:“比较对象应该拿IT企业的股价指数(假如有的话)为例,而不是囊括各个产业的标准普尔500指数。”
那么,为什么非得找齐IT企业不可?其实能够马上清楚回答这个问题的人意外地少。我想这恐怕是因为平常在推论因果关系之际,许多人会在无意识间将比较对象一网打尽。英文当中常将比较对象是否恰当形容成“苹果比苹果”(apples to apples),比较对象失当则形容成“苹果比橘子”(apples to oranges)。
虽然这里想要比较“(原因)咨询服务的有无→(结果)企业价值不同”,推估咨询服务和企业价值的因果关系,但若这时咨询服务有无以外的条件没有尽量找齐,就不晓得是咨询服务对提升企业价值发挥了功效,还是除此之外的相异条件(像行业的不同等等)在起作用。
大家或许认为找齐恰当的比较对象很简单,照理说这不会有错,但做起来却出乎意料地困难。接下来要看几个实际的例子,烦请大家一起思考哪里不对劲。
1986年1月28日,从肯尼迪太空中心(Kennedy Space Center)发射的美国航天飞机“挑战者号”,从发射升空起73秒后就爆炸解体,7名乘组人员罹难。7名组员中包括高中女教师克里斯塔·麦考利夫(Christa McAuliffe,1948―1986)女士。原本她计划从太空进行授课,却在全美包括孩童在内的许多观看发射升空直播的观众面前发生重大意外,给整个美国带来极大的影响。
当时的总统里根(Ronald Reagan)中止原定的国情咨文演讲,事故当晚向全美发表紧急演说。
事件发生后,根据在总统之下设置的特别委员会所进行的调查,发现这起事故的原因,是在火箭接合处的橡胶制零件O形环出了状况。然而,这个O形环并非这次发射升空之后才出的状况,其实从以前发射升空时就有毛病了。只不过先前至少没造成重大事故,直到1月28日那致命的一天。
现在,让我们把时针拨回到1月27日,也就是出意外的前一天。当时美国太空总署(NASA,National Aeronautics and Space Administration)的工程师和设计O形环的赛奥科公司的工程师,再三研议隔天1月28日是否该发射升空。他们预测28日发射升空时气温极低(2℃左右),需要弄清楚气温是否真的跟O形环出状况有关。
工程师眼中所见发射升空时出状况的气温和出状况的关系,就如表1.6所示。
大家从这张图表当中看出气温跟O形环出状况有什么关系吗?
Y轴是出状况的数量,乍看之下,气温和出状况之间的关系也可看成是U字形关系。只不过,若从是否发生问题的观点思考,就会看出在12℃至24℃的范围内,无论在什么气温下,O形环都会发生问题,气温和出状况之间没有关系。正是因为工程师最后的判断,所以才会依照这项判断,将挑战者号发射升空。
其实从“比较”的观点来看,那张表有个致命的错误。
关键在于是否出问题的结果有所不同。因此,假如真的必须要比较,就该比较出状况时和没出状况时的差异。尽管如此,表中却只标示发生问题时的数据,完全没有安插没出状况时的发射升空信息。
表1.7是将整体数据(包含没发生问题时的发射升空信息在内)画成表,从表中可知:
●高于18℃的范围中,发射14次只有2次出状况,发生的概率为大约14%。
●低于18℃的范围中,发射总共4次就全部出状况,发生的概率为100%。
表1.6 航天飞机零件O形环发生问题时出状况的数量与气温的关系
出处:作者根据M. Lichman (2013) UCI Machine Learning Repository. Irvine, CA: University of California, School of Information and Computer Science制作而成。
表1.7 航天飞机零件O形环出状况的数量与气温的关系(所有例子)
出处:作者根据M. Lichman (2013) UCI Machine Learning Repository. Irvine, CA: University of California, School of Information and Computer Science制作而成。
因此可以料想到,预估温度为2.2℃的预定发射升空日,将会有相当高的概率发生问题。从这个分析来看,“挑战者号”的发射升空日本应该延期。
分析的概念在于简单的“比较”。然而,就连美国太空总署老练的工程师们,进行分析时都会弄错比较对象。拿什么跟什么比较,正确的比较在分析中是必要的。
第二次世界大战中,就职于美国哥伦比亚大学(Columbia University)的统计学家亚伯拉罕·沃尔德(Abraham Wald,1902-1950),曾分析该怎么做才能提升美军轰炸机的生存能力。为了提升轰炸机的防弹能力,轰炸机哪个部位要用装甲强化更是重大的问题。显然,只要整架轰炸机贴上装甲,防弹性能就会上升,但是轰炸机就会变重,所以只能挑选要用装甲强化的部位。问题在于究竟该在轰炸机的哪个部位用装甲强化。
调查轰炸后回到基地的轰炸机中弹状况之后,就发现中弹的部位和没中弹的部位如图1.7所示。
图1.7 轰炸机中弹状况比较
分析就是比较。
那么,比较中弹的部位和没中弹的部位之后,该强化哪一边呢?按照常理来想,会认为中弹愈多的地方,就愈得用装甲强化防弹。当时,盟军也觉得该用装甲强化中弹较多的地方。
与此种观点针锋相对,沃尔德反而主张应该强化没有中弹的部位。
其实,在这里,必须比较的不是回得来的轰炸机中弹的情况,而是回得来的轰炸机和回不来的轰炸机有什么差异。当然,未能返航的轰炸机不在眼前,只能以此为前提做推论。可以想象得到,敌机和来自地面的对空炮火,原本就会让轰炸机均匀中弹到某种程度。尽管如此,回来的轰炸机中弹的状况却参差不齐,为什么?从这个现象可以推论,回来的轰炸机没中弹的地方是中弹轰炸机的致命伤,中了就无法返航。
如果上述分析成立,便可知,导致坠机的致命处反而是没有中弹的部位,没中弹的地方才必须用装甲强化。这也显示出恰当的比较(平安返航vs.遭到击落)是很重要的。
就如同轰炸机的情况一样,单凭生存案例推论时无法恰当地比较,因此结论会产生偏差(bias)。这其实是常犯的错误,所以就取名叫作幸存者偏差(survivorship bias)。
本来,为了要认清什么东西有助于生存,就必须比较生存时和无法生存时的案例。不过,人类在思考原因时,往往只会从眼前生存的案例出发。
其实经营管理领域是幸存者偏差极为容易发生作用的地方。
走进书店,就会看到商业书专区陈列着很多书籍。假如硬要大胆归纳这些书,就会发现陈列在书店中的商业管理书,恐怕多半是以下两类书籍:
①根据成功经营者的经验和案例撰述而成的书。
②根据成功企业的案例编撰而成的书。
这两类书基本结构相同,都是从成功案例的共通原因记述成功原因。假如实例有一个以上还算好,但实际上独白类的书籍也很常见。
假如我是①类书籍的工作人员,为了写书而访问50位成功的经营者,结果发现“所有人都一定会吃早餐”。
根据这项分析,若推出的书籍中传达这项信息:“要做个成功的经营者就必须吃早餐。”大家到底会不会在书店拿起这本书呢?恐怕一定是觉得哪里怪怪的吧。我的书有什么不对劲呢?
其实一定会吃早餐的人当中,应该也有很多失败的经营者才是。照理说成功的经营者和企业要与失败的经营者和企业比较,从差异中方能看出真正的成功原因。因此,单纯从成功经营者和企业的角度撰写而成的书籍,或许正是落入了前面提到的幸存者偏差陷阱当中。
那为什么在商业管理书中有很多可能会陷入幸存者偏差呢?一个理由是,成功经营者和企业的信息容易获得,反观失败经营者和企业的信息则难以取得。成功的经营者会告诉我们很多事情,失败的经营者则三缄其口。另外,企业要是遇到重大失败就会破产,说不定连企业本身都会烟消云散。
无论如何,我们无法否定许多商业管理书有可能没有做恰当的比较,陷入幸存者偏差当中。既然没有恰当的比较,书上的结论也许就不该当成案例实证的结果,而是要彻底当成假设层次的内容才好。
要看穿内容的真伪,就要靠大家自己了。
在寻找因果关系的过程中,或者说在进行比较之际,除了被视为原因的因素之外,最好要找齐条件,或是逆向操作,除了关心的因素之外统统随机分组,将差异平均化后再比较(这是医疗领域当中经常使用的方法,称为随机对照试验)。
随机对照试验是主要用在医疗领域的比较方法。比方说,假如要知道新药的功效,就要将受验者随机分成两个组,一组投以新药,另一组则投以俗称的“安慰剂”而不是新药,比较两组是否产生不同效果,便可以查明新药的效果。
实际上受验者的年龄、生活环境和其他特质不尽相同。然而为数众多的受验者,被随机分为试验新药的小组和试验安慰剂的小组,对其他可能影响结果的因素都尽量平均分配,这样从对结果的影响这一点上就可以忽略这些因素的差异了。随机对照试验或许称得上是比较的终极形态之一。
医疗领域姑且不论,以往人们认为这种实验式的比较难以落实在商务领域当中,因为单是确保充裕到足以比较的数据量就很困难。然而世界进入网络时代以后,实验式的比较以A/B测试的形态被广泛运用,状况大为改变。
A/B测试是实验新措施是否实际影响结果的方法。比方说,让实际在网络上访问网站的人随机看两种网站款式,就跟前面的新药测试一样,比较两者有什么程度的效果。
A/B测试的例子,可以看看2012年美国总统选举中奥巴马阵营所运用的分析。奥巴马阵营继2008年的总统选举之后,又在2012年的总统选举上运用A/B测试,筹划争取捐款 。
图1.8的照片是手机版网站,当初是在“网站该尽量简洁”这一假说的影响之下,就如左边所示,拿掉了奥巴马总统的照片。不过在A/B测试下,跟放了奥巴马夫妇照片的网站比较之后,就发现有照片的网站多了6.9%左右的捐款。
奥巴马阵营在2012年的选战当中像这样实施了500次A/B测试,计划要做出最适宜的网站。
另外,据说高级餐厅的菜单省略美元的符号($)之后,就有更多顾客点菜。奥巴马阵营从中获得启发,产生一个假说。那就是从捐款金额上拿掉$之后,捐款就会增加。尽管实际进行了捐款金额上加$和没有加$的A/B测试之后,结果并没有出现差异。
综上所述,我们可以看出,分析的本质是要解释因果关系,运用比较以便在行动时拿出成果。
图1.8 美国总统选举手机版网站的A/B测试
出处:http://kylerush.net.
其实,高效分析需要独特的动脑法,遵循思考步骤(假说思考)。在实际着手分析之前,要事先设想通过分析解释什么,该说什么才好,而不是没头没脑地分析。就如图1.9所示,可以简单理解为“分析=假说思考×比较”。
图1.9 分析=假说思考×比较
下一章我们要一起看看假说思考这个动脑分析的方法。在此基础上,从第三章起,我们要进一步思考用分析来比较之际该注意的比较观点,以及实际的比较方法。
1.现在你看到一则实际金融机构的广告。其中信息如下:“请你给我们3分钟的时间。只要3分钟,85.1%的人(※)会发现资产运用的必要性。”
从分析的观点来看,这项信息当中有几个重点,请问在哪里呢?
※该公司以全国20至59岁的1000名男女为对象,实施的“3分钟看得完的年终奖金运用手册”网络调查当中,对于“(阅读‘3分钟看得完的年终奖金运用手册’之后)你觉得资产运用必要到什么程度?”这一提问,结果回答“觉得必要”和“稍微觉得必要”的人总共有851名,这代表占1000名调查对象人数的比率为85.1%。
2.这也是一则广告。刊登的图表似乎在透露“过了20岁之后,辅酶Q10就会不够”。假如内容当中有重点,那会是什么呢?
表1.8 辅酶Q10过了20岁之后就会不够!
出处:Hoppe U. et al. (1999), ”Coenzyme Q10, A Cutaneous Antioxidant and Energizer,” Biofactor 9 (2-4): 371-378.
出处:International CoQ10 Association.
3.小学改采小班制是文部科学省正在研议的重点(2015年)。小学平均每班孩童数的平均值,日本为28.0人,经济合作暨发展组织(OECD,Organization for Economic Cooperation and Development)调查到的平均值则为21.6人,看来日本小学每班的孩童数比较多。的确,小学一班孩童数量少的时候,老师的教育指导也能比较到位。
班级规模小真的可以提升孩子的成绩吗?假如能够做实验实际改变班级规模就好了,但考虑到公平性,社会性实验似乎是窒碍难行。该怎么做才可以验证班级的规模(人数)是否会影响成绩?请务必谈谈你的想法。