数学命题只要和现实有关,它们就是不确定的;只要它们是确定的,那么就和现实无关。 (著名物理学家 阿尔伯特·爱因斯坦)
有3个原因让人们相信一些事物是不可量化的,但每个原因其实都是对量化的错误理解造成的,它们分别是量化的概念、目标和方法。
量化的概念 量化的定义被广泛误解,如果人们理解“量化”的真实意义,很多事情都会变得可量化。
量化的目标 并非被量化的事物隐藏得很好,只是模棱两可、含混不清的语言挡在我们的量化之路上。
量化的方法 很多人不了解实证观测者的量化过程。如果人们熟悉这些基本方法,那么很多原来认为是不可量化的东西,不仅可以量化,而且人们会发现,它们早就被量化过了。
记住这些的一个好方法是使用像“howtomeasureanything.com”之类的助记符,这里在“.com”中的c、o、m分别代表概念(Concept)、目标(Object)和方法(Method)。一旦我们了解了这3个障碍是出于对量化的某种错误理解,那么很显然,万物都可量化。除了这些误解之外,关于为什么某些事物“不应该”被量化,还有3点常见理由:
和概念、目标、方法不同,这3条反对意见并不认为量化是不可能的,只是认为它太花钱、没意义或者不符合伦理道德。我认为,只有从节约角度反对量化还有一定的道理,其他两点都没有道理可言,而第1点也被过分夸大了。
对那些相信某些事物是不可量化的人来说,量化的概念,或者说对量化的误解,也许是需要跨越的最大障碍。
如果我们错误地认为,量化就意味着要达到近乎不可能达到的精确程度,那几乎没什么事情是可以量化的。我在给每届研讨班学员上课,或者作大会演讲时,都会问他们心中的“量化”是什么意思。我觉得挑衅那些主管创新性量化工作的人的观点,是一件很有意思的事情。我经常听到类似“确定某物的数量”“计算一个精确值”“将多个值减少为一个值”“选择一个有代表性的数值”等这样的回答。所有这些回答传递的显性或隐性意思是,量化是确定的,应该获得一个精确数值。如果这就是“量化”的真正含义,那么几乎没什么事情是可以量化的。
但是当科学家、精算师或统计学家进行量化工作时,他们似乎使用了不同的定义。在各自的领域,他们每个人都知道有时某些词的确切词意和人们普遍理解的有很大不同。因此,这些专业人员对“量化”不会有太多疑义。“精确性”这一关键词在各领域的专业术语定义中都不只一句话,而是一个更大的理论框架的组成部分。例如在物理学里,“引力”并非像某些字典定义的那样,而是一个包括质量、距离以及时空作用等与重力相关的概念的特殊等式的组合。与之类似,如果我们想在同样的专业水平上理解量化的含义,就不得不了解其背后的理论框架,否则就不会真正理解它。
通常而言,科研人员都会把量化看成是在数量上减少不确定性的观测结果。注意是减少而不是完全消除不确定性,但对量化工作而言,这就足够了。即使不能精确地陈述这一定义,科学家使用的方法也会清楚地表明他们完全明白这一点。犯错是不可避免的,但仍然会在前人基础上有所提高。这是做实验、调查研究和其他科学量化的指导思想。
量化是在数量上减少不确定性的观测结果。这个定义和大众对量化的实际理解有巨大的差别。 一个真正的量化过程不需要无限精确。而且,如果没有报告误差,也没有采用抽样和实验等实证方法,就认为数字是完全精确的,根本不是真正的量化。 真正的科学方法在报告数字时会有范围,例如,农场使用了某种新的玉米种子后,在95%的置信水平上,平均产量会提高10%~18%。对于没有误差的精确数字,除非它们是完全计数,否则不需要实证观测。例如统计口袋里的所有零钱就可以完全计数,而像安然、雷曼兄弟或房利美的资产评估就不需要实证观测。
这种对量化工作的误解有强大的数学基础和现实原因。量化,至少是一种信息;而信息,又有严格的理论为基础。有一门学科叫做“信息论”,是在20世纪40年代由克劳德·香农(Claude Shannon)发展起来的。香农是一个美国电气工程师和数学家,曾研究过机器人和计算机下棋程序。
1948年,他发表了题为《通信的数学理论》( A Mathematical Theory of Communication )的论文,奠定了信息论的基础,而且我敢说,也奠定了量化的基础。现代人不会全都喜欢这篇文章,但他的贡献怎么强调都不为过,因为信息论从此成了所有现代信号处理理论的基础,而且也成了电子通信系统的工程基础。信息论也是使我最终可以在笔记本电脑上写,然后你在亚马逊网站上买,并能用Kindle( 亚马逊网站推出的电子书阅读器。——译者注 )阅读这本书的理论鼻祖。
香农将信号中不确定性的减少量作为信息的数学定义,在信息论中,他用信号代替了“熵”(shāng)。对香农来说,信息的接收者可以描述为具有一定程度不确定性的人。也就是说,接收者早就知道一些事,新的信息只是减少了接收者的一些而不是所有的不确定性。接收者以前的知识或不确定性,可以用来计算诸如在一个信号中传递的信息量的上限、消除噪音所需要的最少信号量、数据可能达到的最大压缩程度等。
这种“减少不确定性”的观点具有很大的商业价值。例如对于一个信息技术大项目或者新产品开发项目,这种不确定性的减少或许能创造几百万美元的价值。
因此,量化不需要彻底消除不确定性。只要进行量化工作的花费远远少于因此而带来的收益,那么量化就是值得的。
另一个与量化有关的关键概念或许会让绝大多数人吃惊,那就是量化得到的数值和我们平常想的不一样。请注意我在量化的定义中说,量化是用数量描述的。不确定性至少要数量化,但被观测的事物可能是不定量的,也可能完全是定性的,例如,我们可以“量化”是否应该奖励一个专利发明人,或者是否会发生一次公司合并,这完全符合我们对量化的定义。但是,观测结果的不确定性必须定量表示,比如我们有85%的机会卷入专利纠纷,公司合并后有93%的把握提升公众形象等。
如果用于是非判断题或其他包含多个定性因素的问题,那么人们对量化的看法就和另一门派一样了。1946年,心理学家斯坦利·史密斯·史蒂文斯(Stanley Smith Stevens)写了篇名为《量度与量化的理论》( On the Theory of Scales and Measurement )的论文。在该文中他提出了量化的几种量表,包括“分类”和“等级”量表。分类量表根据简单的属性分类,例如一个胎儿是男孩还是女孩,或者你是否享有某种特定的医疗条件等。 在分类量表中没有次序之分,数字并不表示相对大小,仅表示某个事物是否属于某个集合而已。
但是,等级量表却可以让我们说一个值大于另一个值,而差值并不表示精确差距,例如电影的4星级评级系统或表示矿物硬度的莫氏硬度表( 一种矿物和其他固体物料硬度的标准。——译者注 )。在这些体系中,4大于2,但并不表示前者是后者的2倍。但是用美元、千米、升、伏特等单位衡量的结果,不仅会告诉我们某一值大于另一值,而且其差值也是确定的,这些“等比”量表可以进行加减乘除运算。比如,看一部1星级的电影,并不等于看一部4星级电影的1/4,但4吨岩石却是1吨岩石的4倍。
分类和等级量表也许会挑战我们对“究竟什么是量表”的理解,不过它们对量化工作仍然有用。对地理学家来说,知道一块岩石比另一块硬是有用的,但并不需要知道到底硬多少,这就是莫氏硬度表的作用。
史蒂文斯和香农从不同侧面挑战了量化的常规意义。史蒂文斯更关心不同类型的分类量化,但对最重要的减少不确定性的概念却一言不发。香农则在一个完全不同的领域工作,或许他对心理学家史蒂文斯两年前在量化领域的开拓性工作一无所知或者毫不关心。如果不把两个人的工作结合起来,我认为要给出一个适用于商业领域的量化定义是不可能的。
还有一个叫做量化理论的研究领域,试图同这两方面以及更多方面的课题打交道。 在量化理论中,量化是对被量化的事物和数字的一种映射(Mapping)。 这个理论很深奥,但即使只关注香农和史蒂文斯的贡献,就足够很多管理者学习了。一般人认为,量化的结果应该是确定的数值,如果消除不确定性是不可能或不经济的,那么他们就会忽略量化在减少不确定性方面的作用。而且,并非所有量化都需要一个传统的量值,量化也可用于离散数据。例如,我们会赢得诉讼吗?这项研究和开发计划会成功吗?量化还可用于连续数据,例如,新产品的某个特性给我们带来了多少收益?在商业领域,决策者是在不确定性下作决策的,如果不确定性很大,决策就有较大风险,因此减少不确定性很有价值。
即便我们接受了“量化就是减少不确定性的观测”这一更加实用的概念,也会由于第一次遇到某些事物不知如何量化而以为这些事物也是不可量化的。在这种情况下,是因为我们没有明确的量化方法,如果有人问该怎样量化战略整合或者顾客满意度,我就会简单地反问:“你确切的意思是什么?”当看到人们进一步详细了解他们使用的术语,并在此过程中自动解决了量化问题时,我觉得很有趣。
在研讨班中,我经常要求学员用很难或看起来不可能量化的难题挑战我。有一次,一个学员问怎样量化师徒关系的好坏。我说:“这听起来是一个人们感兴趣的量化话题,我会说亲密的师徒关系比疏远的关系好,我看到人们在寻找促进师徒关系的方法,所以我能理解为什么有些人想量化它。那么,对你来说,师徒关系是什么意思?”那个人立刻回答:“我想我不知道。”我说:“那好,也许那就是你相信它难以量化的原因,你还没有弄清楚它到底是什么。”
一旦管理者弄清楚要量化什么以及被量化的事物为什么重要,就会发现事物显现出更多可量化的方面。 这往往是我分析问题的第一步,我称之为澄清工作。客户在陈述一个他们想量化,但在开始时比较模糊的特定问题或事物时,这么做是理所当然的。然后我就会问:“你说的某某究竟是什么意思?你为什么关心它?”
这种做法可用于诸多量化难题,我曾多次在IT领域碰到过。2000年,美国退伍军人事务部要我制定IT安全绩效指标。于是我问:“你所谓的IT安全是什么意思?”经过两三个工作阶段后,该部门的人给了我定义。他们最终发现,对他们来说,IT安全意味着减少非授权的网络入侵和病毒攻击。他们继续解释说,网络入侵和病毒攻击可能会使组织遭受诈骗、生产力降低,甚至可能承担法律责任。
在大多情况下,显然所有这些可以识别的影响都是可量化的。“安全”是一个模糊的概念,直到最终分解细化到他们希望量化的各个方面。但是当定义这些最初的概念以引领他们进入量化领域时,他们仍然需要进一步的指导。对于更困难的工作,我会使用一种被我称作“澄清链”的东西,如果还不起作用,也许就要进行某种思想实验了。
澄清链就是把某物想象为无形之物再到有形之物的一系列短的链接过程。
首先,如果X是我们关心的某种事物,那么根据定义,X必须可通过某种方法来感知。如果质量、风险、安全、公众形象等事物完全不可感知,那我们该用何种直接或间接的方法关注它们呢?我们关心某些未知数据,是因为我们觉得它和希望或不希望的结果有某种关联;
其次,如果这个事物可以感知,那必然能估计到某些数值。如果你可以观测一个事物,就多少能得出一些东西。
最后,这一步或许是最容易的了:如果可以通过观测得到某些量,那它就一定是可量化的。
一旦我们弄清了为什么关心一个“无形之物”,就能找到量化的方法。比如我们关心公众形象,是因为它会影响到顾客推荐,顾客推荐会产生广告效果,从而影响销售。顾客推荐不仅可以被感知,而且与之相关的某些数据是可以获得的,这就意味着它们是可以量化的。我也许不会在每一个难题上都带参与者走过澄清链的每个阶段,但如果我们对这3个步骤牢记于心,这个方法就会起作用。
如果澄清链不起作用,我会尝试用思想实验来解决。想象你是一个来自异国的科学家,不仅可以克隆羊,而且还能克隆人甚至整个组织。这么说吧,假设你正在研究某个快餐连锁店,或研究某个无形之物例如员工授权的效果。为了研究,你设立了2个组,一个叫“实验组”,一个叫“控制组”。
现在假设你对实验组的员工授权多一点,而控制组的员工授权不变。要是真的做观测的话,你能想象实验组会产生何种变化吗?你能想象组织会作出什么决策吗?由于你的观测可能会给雇员产生影响,这是否会使决策变得更好更快?是否意味着雇员不需要那么多的监督了?如果你能找到一个观测角度,通过这个角度观测到两组的结果不一样,那你就已经行进在量化之路上了。
清晰表述我们想量化某物的原因以理解真正要量化的东西,也是必要的。定义要量化的究竟是什么常常是量化工作的关键所在。在第1章,我提到管理者感兴趣的所有量化必须能支持至少一个特定决策,例如我应某人的要求,帮助他量化减少犯罪的价值,但当我问他为什么要量化这个问题时,发现他真正感兴趣的是,为罪犯使用的特定生物特征识别系统建立一个商业项目。也有人问我如何量化合作,后来发现该量化的目的是解决是否需要一个新的文档管理系统。在每个例子中,量化目的会给我们提供真正要量化什么以及该如何量化的线索。另外,我们还发现了好几个可能需要量化且可以支持相关决策的潜在因素。
确定真正要量化什么,是几乎所有科学研究的起点。商业领域的管理者需要认识到,某些事物看起来完全无形无影,只是因为你还没给所谈论的事物下定义。 搞清楚你的意思到底是什么,就已经完成了量化工作的一半。
一些事情看起来似乎不可量化,只是因为人们不知道基本的量化方法而已,比如用于解决量化问题的多种抽样过程或控制实验。一个反对量化的观点是,量化难题具有独特性,并且以前从未量化过,因此还没有揭示它价值的方法。持这种反对意见的人无一例外会说,这要求量化的人具有更高的科学素养,而不仅仅了解基本的实证方法就行了。
了解几种已经证明有效的量化方法,有助于我们量化某些最初认为不可量化的事物,举例如下:
进行很小的随机抽样量化 你可以从潜在顾客、员工等很小的样本里获得一些东西,尤其是存在较多不确定性的情况下。
不可能获得所有数据时,可对总体的一个样本进行量化 确定海洋里一种鱼的数量、雨林里一种植物的数量、新产品中不合格的数量,或者对你的信息系统进行未授权的访问但又没有被检测到的次数,都有更聪明和更简单的量化方法。
当存在很多其他变量甚至未知变量时,该如何量化 在宏观经济、竞争对手的失误或者新的定价策略等因素下,我们可以确定一种新的程序是不是销量提高的真正原因。
量化小概率事件的风险 火箭发射失败、另一场“9·11”、另一次新奥尔良的防洪堤溃坝、另一次重大的金融危机发生的概率,都可以通过观测和推理等有价值的方式来预防。
量化客体的偏好和价值取向 通过评估多少人真正付款,我们可以量化艺术、自由时间或减少生活中的风险所带来的价值。
这些量化方法中的绝大多数,仅仅是基本方法的变种。这些基本方法包括几种抽样和控制实验类型,有时也包括从几种问题中选择一个重点来关注。在商界的某些决策过程中,这些量化方法基本上都被忽略了,或许是因为人们觉得这种科学的量化过程有点过于精细和正式。如果量化时间不长、准备工作不多,花费也很少,人们一般认为没必要做这些工作,但它们确实会起重大作用。
这里有一个很简单的例子说明任何人都可以通过统计学上的简单计算完成一次快速量化。假设你考虑为你的业务增加更多的远程办公系统,此时,一个相关因素是每个雇员每天花在通信上的平均时间是多少。
你或许会在全公司范围内进行一次正式调查,但那太费时费钱,而且你并不需要太精确的结果。如果你只是随机地挑出5个人,那样是不是更好些?关于如何随机选择,后面我们还将讨论,现在,你就闭着眼睛从员工名录中挑几个名字吧。然后把这些人叫来,问他们每天用于通信的常规时间是多少。一个人的回答算一个数据,当你统计到5个人时就停止。
现在假设你得到的数值各是30分钟、60分钟、45分钟、80分钟和60分钟,其中最大值和最小值分别为30和80。因此所有员工用时的中间值,有93.75%的可能在这两个值之间,我把这个方法叫做“5人法则”。5人法则简单实用,而且在统计学上有着广泛应用,样本数量也比你以前估计的数量要小,但适用范围大,确实算得上一种优良的量化方法。
仅仅5个随机样本就可获得到93.75%的确定性,这看起来似乎是不可能的,但事实就是这样。该方法之所以有效,是因为它估计的是群体的中间值。所谓“中间值”,就是群体中有一半的值大于它,而另一半值小于它。如果我们随机选取5个都大于或都小于中间值的数,那么中间值肯定在范围之外,但这样的机会到底有多大呢?
随机选取一个值,根据定义,它大于中间值的机会是50%,这和扔硬币得到正面的机会是一样的。而随机选取5个值,恰好都大于中间值的机会,和连续扔5次硬币都得到正面是一样的,因此机会是1/32,也就是3.125%。连续扔5次硬币都得到反面的机会也一样,所以扔5次硬币不会得到都是正面或反面的机会就是100%-3.125%×2,也就是93.75%。因此,在5个样本中,至少有一个大于中间值且至少有一个小于中间值的机会就是93.75%,如果保守一点,可以取整,即93%甚至90%。一些读者或许会记得小样本的统计学课程,当中的方法比5人法则复杂多了,但是结果却好不到哪儿去。关于这一点,我将在后面更详细地讨论。
我们可以根据经验,通过使用某些具有偏向性的简单方法,来提高估算精确度。例如,也许近期的城市建设使得每个人对平均通勤时间的估计偏高,或者通勤时间最长的人请假了,因此没有选入样本,这将导致样本的数值被低估。但即使有这些缺点,5人法则在提高人们对量化的直觉能力方面还是很有效的。
稍后我将探讨其他几种进一步减少不确定性的方法,包括更加细致的抽样或实验法以及可以从专家的主观判断中去除更多错误的简单统计方法。如果我们希望估计更精确,就要考虑各种因素。但请记住,一种观测只要可以告诉我们过去不知道的东西,那它就是一种量化方法。
在商业领域,如果因不能在现有的会计报表或数据库中找到针对某个特定问题的数据,而给这个问题贴上“无形之物”的标签,就为时尚早了。另外,即使认为量化是可能的,但需要特定领域的专家或者商业人士亲自进行也是不实际的。幸运的是事情不会到这一步,因为任何人都可以根据直觉找到一种量化方法。
了解单词“实验”(Experiment)的来源,是我们要学习的重要一课。“Experiment”一词来自于拉丁语,ex意思是“的/从”(Of/From),peri意思是“尝试/试图(Try/Attemp)”,因此Experiment意为通过尝试获取某物。1998年美国统计学会的主席、统计学家大卫·穆尔(David Moore),对此作了最大限度的延伸。他说:“如果你不知道要量化什么,就用各种手段量化吧,最终你将学到要量化什么。”我们或许会把穆尔的方法叫做“耐克方法”或“尽管去做”(Just Do It),这听起来像先量化再问问题的量化哲学。如果走极端的话,我能找到该方法的一些缺点,但和一些管理者完全不知道该如何开始量化相比,其优点更多。
考虑到量化的各种障碍,很多决策者甚至都不想尝试量化。如果你想做一项调查,看看人们在一项具体行动的讨论上会花多少时间,他们会说:“那好,但是人们不会精确记得他们花了多少时间。”如果你想调查消费者偏好,他们会说:“消费者之间的差异太大了,因此你需要一个巨型样本。”如果你想量化一项创新是否提高了销售,他们会说:“有很多因素影响销售,你永远不会知道那项创新到底有多大影响。”类似这样的反对意见早就假定了观测结果会怎样。而事实是,这些人并不知道这些因素是否会让量化毫无结果,他们只是抱着先入为主的想法。
这些批评量化的人都带着一堆“量化是困难的”假设,甚至声称只有具有量化背景的人才具有一定的权威性,而这些人也仅仅是在20年前学过两个学期的统计学而已。在每次量化时我都不会说这些假设是否真实,我会说如果他们只是这么简单假设,那就不会产生生产力。从原有的和新的量化数据中能获得什么信息来减少不确定性,进而支持决策,是可以通过一定的计算得出结论的。但在声明不可能量化前,他们几乎从未作过这种计算。
现在让我们来作一些深思熟虑的、有建设性的假设来代替那些没劲的假设吧。我提出了一些相反的假设,这些假设或许并非在每种情况下都正确,但实际效果还不错。
无论某个待量化问题看上去多么独特,我们还是应该假设或许在另一个领域,它早就被别人量化过了。如果这个假设不对,那就愉快地幻想你的发现或许能获得诺贝尔奖金吧,哈哈!说正经的,我早就注意到,在每一个专业领域都有一个趋势,那就是本行业人士都会认为他们领域的问题特别难或具有独特性。他们说的话一般都像这样:“和其他行业不同,我们行业里的每一个问题都是独特的和不可预料的……我的行业在量化方面有太多的因素需要考虑。”在绝大多数领域中,都有一些人这么说。迄今为止,他们说的每一个难题最终都转化为和其他领域没什么不同的量化问题。
你手里的数据比你想象的多得多。你需要的信息就在你触手可及的范围内,如果你花时间思考的话,或许就会找到它。一些首席执行官几乎都不注意组织里日常记录和跟踪的数据。和量化有关的事物一般都会留下踪迹,如果你足够机智,就一定能够找到相关数据。
你需要的数据比你认为的要少得多。到底需要多少数据就可将不确定性减少到足以评估问题的程度?可以通过一种特定类型的计算获得这些数据。当我们弄明白一组给定数据到底减少了多少不确定性时,我发现管理者经常对能从如此少的数据中得到如此多的信息感到惊讶,尤其当从极不确定的情况下起步时。这就是5人法则可以解决那么多初看起来十分困难的问题的原因。正如埃拉托色尼、费米、艾米丽给我们演示的那样,这世上的确存在从少量数据中找出有趣发现的精妙方法,也有通过简单分解问题并评估各个部分从而获取有用信息的方法,比如不需要复杂庞大的临床实验,就能知道一个常用的医疗保健方法是不是骗人的。
在后面的章节我们还将发现,通过适当的努力,在初期阶段做的一些观测一般会在减少不确定性方面获得很高回报。实际上,人们存在一个普遍误解,就是不确定程度越高,越需要更多的数据来减少它。我们用一个极端的例子来说明:你拥有的数据比你认为的要多,你需要的数据比你认为的要少。
布鲁斯·劳博士是芝加哥虚拟特许学校的负责人。芝加哥虚拟特许学校是一所创新型公立学校,主要进行网上教学。远程教学方法要求个性化的课程体系设置,劳博士请我帮忙找出评估教师和学校表现的有效量化方法。所以,我的头等大事就是定义什么是绩效以及它如何影响真正的决策。
劳博士最初关心的并不是获得足够数据以量化有效教学下的诸如“学生努力程度”和“区别”等结果。正如我说过的那样,我发现大部分课程是在互联网上通过交互式Web会议的方式教授的,相关软件可以记录每堂课的教学课程。这种在线工具允许学生通过声音或文本提问,并在教学过程中和教师互动。教师和学生们在线做的所有事情都会被记录下来。
因此,问题并不是缺乏数据,而是这么多的海量数据并不是结构化的、容易分析的数据库数据。和绝大多数管理者面临相似的处境,芝加哥虚拟特许学校觉得如果不重新回顾所有数据就不能开展任何有意义的量化工作。因此我提供了一种抽样方法,可以让管理者随机选择课堂记录和该课堂的特定片段,每个片段大概一两分钟长。这是对教师和学生正在课堂上所做事情的随机抽样。
劳博士后来说:“一开始我们认为没有相关数据,后来知道原来有很多数据,但谁有时间从头到尾看一遍呢?再后来我们知道了无需观看所有课堂记录,也可以很好把握教学情况。”
新的观测方法比你认为的要更加切实可行,而且量化方法也比你想象的简单得多。假设你首先想到的是一个复杂的量化方法,但你具有一点天赋,进而可以找到一种相对容易的方法。例如,克利夫兰管弦乐队想量化他们的演出水平是否提高了。很多商业分析人士或许会提出对赞助人进行长期的重复随机抽样,或者对演出水平从很差到优秀分组打分,然后可以根据几个参数形成一个满意度指数来评估他们的演出水平。但克利夫兰管弦乐队根据手头的数据,采用了更为巧妙的方法。它首先计算观众起立鼓掌欢呼的次数,当然,欢呼次数相差一两次并不足以说明演出有明显差异,但如果在换了乐队指挥的几场演出中,起立鼓掌欢呼的次数有较大提升,那我们就可以得出关于新乐队指挥的一些有用的结论了。从任何角度看,这都是一个量化方法,一个比抽样调查更省事也更有意义的量化方法。
因此,不要假设减少不确定性的唯一方法就是使用不切实际的复杂方法。你试过在同行阅读的杂志上发表专业文章吗?或者想过怎样减少生活中的商业决策的不确定性吗?想一种可以重复的量化方法,然后开始量化吧。你总是可以根据最初的发现不断调整该方法,最终达到目的。
最重要的是,如同单词“Experiment”的原始意思一样,实验者要有直觉,要试着去做,这是一个习惯。除非你相信事先已经知道待量化事物的精确结果,否则量化定能告诉你一些以前不知道的东西。多进行量化吧,你将知道得更多。
或许存在极少数情况,比如某些事情看起来似乎是不可量化的,或者需要更复杂的量化方法。但对那些贴着“无形之物”标签的事物,几乎从不需要更加先进复杂的方法。因此, 即使是最简单的量化方法,都可以在一定程度上减少不确定性。
上文提到了某事物不能被量化的3个反对理由:概念、目标和方法,但实际上它们都是简单的幻象而已。但也有反对意见认为,一个事物不是不能被量化,而是不应被量化。
说某物不应被量化的唯一有说服力的理由,就是量化的花费超过了它所带来的收益。这在现实世界中是确实存在的。1995年,我提出了一个方法,我把它叫做“应用经济信息学”,当在作任何一个你所能想象到的重大而且高风险的决策前,你可以用这种方法来评估其中的不确定性、风险和所谓的无形之物。
这种方法的关键步骤就是计算信息的经济价值,这也是这种方法的名称由来。我以后还会展开更多讨论,但决策理论领域的一个已被证明的公式可以让我们计算减少一定程度不确定性的经济价值,多年来我一直用它来计算辅助各种大型商业决策的量化的经济价值,这些量化包含至少十几个变量。我发现一个有趣的问题:商业案例里的绝大多数变量的信息价值为零。一般来说,通过精心设计的量化程序,搞定1~4个具有不确定性的变量,就足够正确决策之用了。
虽然有些变量确实不需要量化,但关于这点人们有一个根深蒂固的误解:除非量化结果符合一个特定标准,例如适合在学术刊物上发表,或者满足大家都接受的会计标准,否则它就没有价值。这个想法很单纯,但一项量化工作是否满足其他标准其实无关紧要。如果你投入巨资进行量化,减少一个变量的不确定性,那么就可以计算不确定性边际减少(Marginal Reduction)的经济价值。
例如,假设你想为产品设置一种高成本的新功能,此功能让其销量最高可提高12%,但也可能没有影响,此外,你认为该项创新在经济上不划算,除非销量至少提高9%。如果你投资,而销售增长率小于9%,说明你的努力没有收益。如果销量提高很少,甚至是负的,那这个产品的新功能将是一个灾难,大量的钱就付之东流了。因此,事先对此进行量化就有很高的价值。
当某人说量化某个变量费用太昂贵或过程太复杂时,我们就要问问他跟什么相比。如果量化的信息价值为零或接近零,当然就不需要量化了。但如果量化具有相当大的价值,我们必须问:“究竟有没有量化方法可以减少足够多的不确定性,以证明量化的花费是合算的?”一旦我们认识到哪怕部分减少不确定性所带来的价值都是巨大的,那么量化工作就是有价值的。
从经济角度反对量化的另一个意见是,量化会对其他人的行为产生影响,从而让管理者错误决策。例如,提供电话咨询服务的绩效指标是接了多少个电话,这会鼓励业务员接听电话并解决顾客问题。一个著名的实例就是20世纪90年代得克萨斯州学校被称为“休斯敦奇迹”的绩效系统,当时公立学校用一套崭新的绩效体系来衡量教育成果。现在我们知道,这项奇迹的唯一作用就是鼓励学校开除差生。这肯定不是纳税人当初的资助目的。
由于花钱量化后产生的结果不是当初要达到的目标,甚至会产生负面影响,那么就没必要开展量化工作。实际上这种反对意见是把要量化的东西和激励混淆了。对任何给定的量化体系来说,都可能存在种类极多的激励机制。这种反对意见假设:因为一个量化体系是某个无效激励方案的一部分,所以任何量化工作都会产生负面激励行为。这世上再没有比这更荒谬的假设了。如果你可以定义你想要的真正结果,可以给出例子,还可以确定如何观测结果,那你就可以设计出可行的量化方法。问题在于,管理者只是简单地量化看起来最容易量化的部分,也就是说,仅仅量化他们现在知道如何量化的部分,而没有量化最重要、最应量化的部分。
另一个反对意见基于以下观点:虽然量化是可能的,但没意义,因为统计资料和概率本身是没意义的。甚至在就职者教育程度普遍较高的职业领域中,也经常存在对简单统计资料根深蒂固的误解,一些人根本不知道该如何看待它。下面是我偶然碰到的几个例子:
某个参加我的研讨班的人 每件事都有同样的可能,因为我们不知道将发生什么。
一个保险公司的中层管理者 我对风险没有任何承受力,因为我从不冒险。
一位客户 如果我连某个事物的含义都不知道,怎么会知道它大概在什么范围之内呢?
一个听我演讲的研究生 如果我们不知道将发生什么,怎么会知道硬币有50%的概率朝上?
一条关于统计学的广为使用的习语 你可以用统计数字证明任何事情。
我们先谈谈上面最后一句话。现在我愿意提供10 000美元奖金,给任何可以使用统计数字证明“你可以用统计数字证明任何事情”这个论断的人。我所谓证明的意思是,这种证明能发表在任何主流的数学或科学期刊上,因为这样一个里程碑式的发现当然应该享受这种待遇。奖金获得者可以使用被大家承认的包括数学和科学领域中的任何理论和方法,甚至可以借助概率论、抽样方法和决策论等。
2007年我首次公开发布了这个奖项,就像第2章提到的,兰迪奖金是为了颁发给证明超自然现象的人一样。不过,遗憾的是,该奖金至今还没人领取。兰迪奖金不止一个人想领取,而这个奖项之所以无人领取,也许是因为“你可以用统计数字证明任何事情”这个论断,要比“我能看穿你的心思”显得更加荒谬吧。
关键是,当人们提到可以用统计数字证明任何事情时,其真正含义也许并非真的是统计数字,而是对数字的广泛使用。而且他们的真正用意是数字可用于迷惑大众,尤其是缺乏基本数字技能、容易上当受骗的人们。对于这一点,我完全同意。
我刚才列出的几个反对意见应该是对概率、风险和量化等基本概念的常见误解。我们使用概率是理所当然的,因为不能确定最终结果。而实际上,就连在驾车上班的过程中,我们都在承受一定的风险,所以都有承受某种程度风险的能力。
我经常发现,持“你可以用统计数字证明任何事情”这种言论的人,其行为往往背叛其言论。如果你让人猜测扔12枚硬币会出现正面的次数,那些声称机会不能确定的人,会围绕6来猜测。与此类似,那些声称不愿意承受任何风险的人,仍然会乘俄罗斯国际航空公司的飞机飞往莫斯科捡100万美元的奖金,而俄航的飞行安全记录比任何美国航空公司都差得多。围绕统计学和概率论的基本误解都来自于持“不能完全预测未来”这一观念的阵营。一些出版物如《统计学教育》( The Journal of Statistics Education )杂志,就致力于识别并纠正这些误解。我希望读者在读完本书后,会减少误解。
现在我们讨论最后一种反对意见,它来自于伦理方面。量化工作有时会被认为是非人性化的。当人们试图在让人敏感的领域展开量化工作时,例如濒危物种的价值或人生的价值,某些人会基于正义而愤慨,但某些机构仍然进行了量化。
为了保护我们的生活环境、健康甚至生命,美国环境保护署(The Environmental Protection Agency,以下简称EPA)和其他政府机构不得不调配有限的资源。我曾帮助EPA评估一项地理信息系统(Geographic Information System,以下简称GIS),该系统是为了更好地跟踪甲基汞( 一种具有神经毒性的环境污染物,主要侵犯中枢神经系统,可造成语言和记忆障碍等。——译者注 )的含量,因为如果儿童暴露在高浓度的该物质环境中,其智力就很可能会降低。
为了评估是否应该建立这个系统,我们必须问一个重要但却让人不怎么舒服的问题:为了减少儿童存在潜在智力受损的可能性,是否值得开展为期5年、投资超过3亿美元的项目?一些人或许觉得很愤怒,因为他们认为这种没道德的问题就不该问,更不用说回答了。你也许会认为,儿童的任何智力受损都比这笔投资重要。
但是EPA还得考虑跟踪其他新污染物的投资项目,这些污染物有的会导致人们过早死亡。EPA的资源有限,在公共健康、保护濒危物种、提高总体环境方面有那么多的投资项目,因此它不得不比较各个提案,询问有多少儿童、智力受损的程度有多高、有多少人过早死亡等问题。
当有限的资源迫使我们作出选择时,有时我们不得不问:为什么说“过早死亡”?因为一个年纪很大的人去世和一个年轻人去世是不一样的。有段时间,EPA考虑使用所谓的“高龄死亡折扣”来计算价值,也就是70岁以上死亡的人的价值相当于70岁以下死亡的人的38%。一些人对此感到愤怒,因此在2003年,EPA的官员克里斯汀·托德·惠特曼(Christine Todd Whitman)发布声明说,该“死亡折扣”仅供参考而没有用于制定政策,而且现在也不用了。当然,作为一项量化工作,它和我们做的其他量化工作并没有什么不同,但如果老年人和年轻人的生命价值真的一样,我们在平等之路上还能走多远?难道一个99岁又疾病缠身的老人和一个5岁大的孩子的价值是一样的吗?无论你怎么回答,都反映了你对人的相对价值的量化。
如果我们非要对各种公共福利政策的相对价值视而不见,那我们肯定会把有限的资源用于解决价值相对较小的问题上,而且还要花更多的钱。因为对EPA来说,他们可以制定出各种投资组合方案,如果对各种问题的数据缺乏一定程度的了解,几乎很难找到最佳方案。
其他领域的情况也类似。我们知道,在实证测量中,误差几乎总是会存在的,可是只要看起来存在任何一点误差,都会让某些人对量化的道德性大发雷霆。《测量的谬误》( The Mismeasure of Man )的作者史蒂芬·J.古尔德(Stephen J. Gould)曾经激烈地反对用智商或“G因素”来量化人的智力,甚至认为这么做是不道德的。他说:“G因素无非就是一个使用人为的数据并运用数学运算得到的结果而已。”智商和G因素当然存在错误和偏差,我们现在都知道量化并不意味着完全没有误差,如果因为测量存在误差就认为智力不可量化,就显得非常幼稚了。
而且其他研究者也指出,认为“对智力的量化和对任何真实现象的量化不一样”的观点,和“这些量化中使用的各种‘数学过程’是高度相关的事实”是不一致的。如果智商和其他观测到的真实现象存在相关性,它怎么就是一个纯粹任意设定的值呢?我不想试图解决这个争议,但我对古尔德为什么对某些议题展开讨论感到不解。例如甲基汞对儿童最恐怖的影响之一就是可能会降低儿童的智商。按照古尔德的说法,因为智商不可量化,这种影响是否就根本不存在了呢?或者说即使影响确实存在,但由于智商测验存在错误所以我们也不敢量化。不管走以上哪条路,我们都将以忽视这种有毒物质所引起的潜在危害而告终,由于缺乏量化信息,我们甚至被迫节约资金以便用在其他项目上。这对孩子们来说,简直太不幸了。
事实上,对量化表现出的无知倾向尤其是对不确定性边际减少的无知倾向,从来都不是道德高尚的表现。 如果在高度不确定的情况下凭空想作决策,那么政策决策者或商人就极可能错误地分配有限的资源,这就好比拿我们的生命去赌博。 量化领域和其他很多人类努力奋斗的领域一样,无知不仅仅会造成浪费,而且也很危险。
到此为止,我们讨论了3个人,他们都使用了富有趣味和直觉性的量化方法。我们还了解到常见的反对量化的意见,此外,还叙述了一些有趣的量化实例。我们发现在某些情况下,除了出于经济考虑的反对意见外,持有有些事物不能或不应该被量化这一观点的反对意见都是对量化的误解。所有这些内容结合起来,从各方面勾勒出了量化的总体框架。
即使量化工作各不相同,但我们仍可以拟出应用于任何量化类型的系列步骤。在第1章结尾,我提出了一个决策框架,可用于解决任何决策难题。这个框架的每个构成部分都是某些研究或行业领域中广为人知的,但之前还没有人把它们结合在一起,形成一个连贯的、可普遍使用的方法。为了让其变得完整,我们需要增加几个概念。这个框架正好是我的应用信息经济学方法的基础。下面我将该过程归纳为5个步骤,并解释每个步骤是如何和本书其他章节联系到一起的:
步骤1:定义需要决策的问题和相关的不确定因素 如果有人问:我们怎么量化XXX?那他们也许已经本末倒置了。第1个问题是:你面临的进退两难的困境是什么?然后我们可以定义所有和该困境有关的变量,并确定一个大致的方向,如训练效果或经济机会的真正意思到底是什么(第4章)。
步骤2:确定你现在知道了什么 我们需要在确定的决策范围内,将由于数据不明所产生的不确定性数量化。这需要学习怎样使用范围和概率的术语来描述不确定性。定义相关决策以及关于它究竟有多少不确定性,这有助于我们确定相关风险(第5章、第6章)。
步骤3:计算附加信息的价值 信息具有价值,因为它减少了决策的风险,知道量化的信息价值可以让我们确定要量化什么,还会告诉我们该如何量化(第7章)。如果没有和信息价值相关的变量以衡量任何量化方法的价值,请跳到第5步。
步骤4:将有关量化方法用于高价值的量化中 我们将讲解一些基本方法,例如随机抽样、控制实验和在此基础上的一些变化不大的方法。我们还将讨论怎样根据有限数据得出更多结论、怎样隔离一个变量的效果、怎样将软偏好数量化、怎样在量化中使用新技术、怎样更好地利用专家(第9章~第13章)。重复第3步。
步骤5:作出决策并采取行动 当确定成本后,决策者就要面对风险与回报的决策了。任何不确定性都是这个选择的一部分。为了使决策最优化,决策者的风险喜好程度也可以被量化,甚至在战略组合数量较多的情况下,也可以计算最优选择。后面我们将讨论这些方法,还会讨论如何将决策者的风险喜好度、其他偏好和态度量化。本步骤和前面的步骤相结合,形成实用的项目步骤(第11章、第12章和第14章)。
返回步骤1,重复执行,跟踪每次决策的结果,并在下次决策链中进行反馈与调整。例如,如果结果不尽如人意,则无论是否需要干预,新的商业环境都会要求决策者改变经营目标。
我希望在接下来的章节中揭开这些面纱时,读者会对量化逐步深入了解。通过“校准的”眼睛观看世界,用定量的眼光观看每个事物,是促进科学和经济学发展的历史动力。其实,人们原本拥有量化的基本直觉,但这种直觉在强调委员会决议和舆论导向而不强调基本观测的环境中被压抑了,所以很多管理者觉得无形之物不能通过简单的方法量化。
我们已经了解到关于量化的好几个误解了。根据上文的讲解,我们也了解了量化的真实含义。我们或许早就在高中的化学实验室里了解到量化的基本概念,但除了量化概念和对有形之物的量化,我们实际上所学不多。
虽然大学里的统计学或许能帮助很多人澄清量化的概念,但当我们走向工作岗位、成为各个领域的专业人士时,就会被各种高中和大学里不可视和不可量化的事物所淹没。我们被告知有些事物就是不可量化的。但正如我们所看到的那样:无形之物仅仅是个神话,量化的困境可以解决,询问与数量相关的问题很有价值,因为商业、政府或私人生活领域中的绝大多数难题所要考虑的各种因素,甚至是最富争议的因素,都要解决与数量有关的问题。看过本书后,即使你不懂如何量化,只要掌握基本步骤,也能学会它。