引言
数字角色的变迁

无论是私人飞机还是商用飞机，都有各种各样的导航工具。其中一种工具叫作高频全向测距仪（VOR/DME）。这种测距仪可以结合机场跑道等物体测量方位和斜距，用高度详细的量化信息给用户提供精确的测量值，确保飞行员即使在无法看清地面情形的恶劣天气下也能安全着陆。高频全向测距仪是数字力量的有力证明，展示了如何在系统中嵌入数字从而改善日常生活。

1997年8月6日，午夜后不久，韩国大韩航空公司（KAL）801航班使用关岛机场的高频全向测距仪信标降落。当时，飞机和测距仪运行良好，机长飞行经验丰富，飞行时长达8900小时，曾在韩国空军服役、执飞的航班至少在关岛机场降落过8次。其他机组成员也是经验丰富、训练有素的专业人员。飞机降落时虽然有雨，却并不危险，这不过是一次由高素质专业人士执行的常规着陆。然而，在测距仪的指引下机长和机组成员驾着KAL801撞向了旁边的山坡。

该机组并不缺乏最新的技术培训，工作人员对导航系统了如指掌，能在各种环境中熟练运用。1999年，当时的韩国总统宣布KAL的事故率是全国性问题，并将自己的总统航班交给本国另外一家航空公司执飞。根据媒体对该事故的报道，导致KAL801航班坠机事故的罪魁祸首是驾驶舱顺从文化，并就此追溯到韩国语言文化中的等级制度。副机长和航班工程师都不敢抗衡他们的上司。更有甚者，他们竟然不敢与机长直接交谈。飞行工程师察觉航班偏离航线时，本应提醒：“机长，这里的跑道没有高频全向测距仪信标。云层太厚了，看不清楚地面，很难着陆。”而实际上，工程师说的是：“机长，天气雷达太管用了。”

后来，大韩航空为了走出连续坠机事故困境，聘请了一位企业文化专家，专家提出要解决问题首先得克服顺从文化。专家给出的对策是把航班的工作语言从韩语改为英语。人们不需要阅读坠机事故调查报告，也能明白语言的变化足以打破根深蒂固的森严等级模式。在说另外一种语言时，人们更容易表达用母语难以启齿的内容。许多人将大韩航空从坠机事故的恶性循环中走出来归功于其企业文化的变革。从1999年至今，大韩航空的航班再也没有发生事故。

我们希望通过该案例说明一种现象，即数字通过创造和运用它的制度文化发挥作用。大韩航空坠机问题的解决方案不应仅着眼于构建人们对于数字的尊重以及数字化的便利，因为飞行员对于数字的服从性和数字化的便利程度已经足够高了。该方案的焦点既不在于追究某些个体的责任，也不是训练机组成员的向上沟通能力，而是促使全体机组成员在航程中时刻积极参与监测数据细节和异常状况。这种做法甚为罕见。这种罕见性是促使我们撰写本书的动机之一。大韩航空的坠机事故或许会促使个体和组织纠正自己关于数字的错误认知，包括数字的自有意义，因此可以被动处理数据的错觉。但是，社会尚未迈出这一步。各式各样的数字渗透到我们的工作和生活的方方面面。我们需要对身体健康、家庭关系、教育和消费者行为做出一系列的个性化选择，在不同的候选人中做出选择，加入或回避某种团体和社会运动，在不同的社会政策之间权衡利弊。我们往往希望自己和他人都有充分的理由做出种种抉择。我们通常将上述种种数据定为决策依据，而忽视定性解释，因为定性模型通常错综复杂，难以理解。我们并非试图创造某种把定性和定量相提并论的规制，或者本着某种把定性和定量凑在一起的非二元态度，也不认为定量信息应该嵌入文化体系中，并由此决定数字的意义。这些疏漏在所谓的后真相时代可谓是雪上加霜，在这个时代，人们被互联网的“深度伪造”和心理操纵所包围，普遍对事实漠不关心，导致理性在情感之前黯然失色，甚至被情感掩盖。

本卷探讨了数字作为事实性锚点的效应。在刻板印象中，定性论述是语言叙事，是事实与观点的混合体；定量数据则是精确、中立和客观的。在现行的框架中，科学知识是数个世纪前从大量话语和评论中产生的，这些话语和论点通过数据之间的持续数字化形成了自然历史。这种观点产生的结果之一是古老的“两种文化”模式，这种模式演变成STEM（科学、技术、工程和数学）学科和所有非STEM学科，亦即软人文科学之间的割裂。人文学科的结论和地位总是有争议的。

二元对立的模式自然是不合理的，所有的学科都是定性和定量的复合体。二元模型仍是一种文化常识。人们当然可以伪造和操纵数字，但是数字所依存的严格方法论也带来了定性推理所缺乏的精度。数字是科学知识的基础，语言则渗透到信度更低的政治文化中。二元对立的刻板印象影响着社会生活的方方面面。例如，在大学里本科生经常被建议放弃主观且不切实际的人文艺术，转向更加客观有用的STEM学科，这些学科的唯一共同特征就是定量。

定性和定量二元对立的刻板印象也带来了一些政治和社会后果。个人决定和政治决策都必须以数字为起点和依据。

英国国内生产总值（GDP）在2018年的前两个季度间增长了0.4%。（英国国家统计署）

最富有的10%的人口赚取了全球总收入的40%。最贫穷的10%的人口只赚取了全球总收入的2%至7%。（联合国开发计划署）

根据2018年的谷歌学术指数，h5-index为49的《通信杂志》是人文、文学和艺术领域的顶级出版物。（谷歌学术）

截至2015年，全球温度已经比工业化前水平上升了大约1℃，这是11000多年来的最高温度。（气候分析组织）

类似的数字无处不在。我们日益依赖于数字进行自我认知，用数字指标衡量工作成绩，根据大学排名选学校，围绕数字和目标展开政治辩论。本书编撰之时正是新冠疫情大流行的时候，人们对数字的依赖有增无减。每天更新的病例数字和围绕着病毒基本再生数（R0）的辩论主导了政策选择的公众辩论。在全球应该如何解读这些数字？

事实上，社会与数字型数据的关系在悄然变化，而这些变化构成了本书的主题。

正如前文所述，选择两种文化中量化的部分是最常见的意义构建模式。人们或多或少从表层获取数字的价值。

数字主导着各种评估。例如，保罗在学术评估测试（SAT）中考了1070分，加州大学圣巴巴拉分校在全美公立研究型大学中排名第五，剑桥大学在全英排名第一。对智力成就和机构绩效的衡量和对气温或二氧化碳水平的测量非常相似，因而我们似乎可以把数字视为更为公平客观的形式，至少比定性描述更为公平客观。社会科学和自然科学都认为数字具有解决由来已久的理论分歧（参见经济学中所谓的实证转向）的变革力量。

无处不在的数字也常见诸采用定量研究方法的学术文献。这就是将数字的知识权威自然化以实现去历史化的过程。长期以来数字的本质和社会权利一直备受科学史专家和公共行政学者的关注。数十年以来，学者们致力研究数字和定量在登上现代科学和治理文化中心舞台之前，如何去进行制度和学术的积累和构建。他们对统计学、成本效益分析（CBA）、概率、簿记、审计、度量和风险管理追根溯源，展示了它们的客观可靠与可解读性，否认了它们的社会和制度根源，也排除和抹去了不符合现代数字体系的复杂性和经验背景。虽然这些学者当中少有人明确阐述两种文化框架，但是他们展示了数字的阿尔法文化起源于并依赖于哲学和历史的贝塔文化，却非要超越和纠正后者。

我们应将此探究路线称为原始批判。虽然这个概括性术语范畴中的概念有所差异，但总体而言原始批判讲述的是数字思维的发展历程，并不等同于科学客观性的进步。原始批判追踪了数字对治理和科学的渗透，认为其涉及情境性、非正式和定性的知识缺失和转移。数字破坏了可用于批判它的概念手段。数字预设了分类，在分类中对世界观和历史进行解码，这是个一般性的结论。我们必须带着对历史、筛选、意图和目标的认知，基于背景信息对数字进行解读，这才是数字分类的意义所在。

原始批判非常重要，也很振奋人心。同时，它也暗示了定量知识在和定性知识的竞争中总是大获全胜。虽然，这种观点强调的是量化、是一种社会文化实践，但是量化进程一旦开始就必然会压制自身的起源文化，吞并其他方法的概念和制度路径以实现垄断地位，这些都是无可辩驳的事实。以成本效益分析的兴起为例——这种分析基于一个预设，以“支付意愿”作为福利水平的基础，采用无形的估量方法来衡量难以简化成货币指标的价值，估量这些价值的唯一方法就是量化。然而，数字地位的提升就是全部了吗？

与原始批判所暗示的相反，量化并非单向的过程，在很多主题和场景下量化都是可逆的。一些所谓的权威量化模式已经彻底臭名昭著，退出历史舞台。例如，神秘的算术占卜学不再用于指导军事决策，颅骨测量也不再是教育决策的基础。这些例子虽然看着琐碎，却说明了一个道理：当一个数字变得声名狼藉的时候就毫无价值了。对于公众而言，数字逐渐失去威力的过程使得量化的效度受到了质疑，至少对专家来说是如此。

学者们长期致力驳斥科学种族主义等伪科学，这也是原始批判的重要组成部分，这个过程伴随着针对量化的政治、宗教等非专家质疑。这些质疑可能来自左翼、右翼和中立派。例如，对气候科学的否认是典型的右翼模式。这种模式导致了人们对引起全球变暖人为原因的定量证据的否认。2021年2月，得克萨斯州在隆冬时节遭遇了大规模断电，导致数百万人无电可用。州长格雷格·阿博特（Greg Abbott）在面向全国观众的声明中指出，独立的可再生能源系统是“将得克萨斯州推入电力不足境地的罪魁祸首”，无视三分之二的电力损失来自石油和煤炭等传统能源的数据。左翼的质疑通常以揭露生产数字的专家和新自由主义和资本主义意识形态之间联盟的形式出现。

无论是左翼还是右翼的专家对于新冠疫情的说法变化之快令人眼花缭乱，这进一步加剧了公众对于数字的怀疑。在某种程度上，人们或许会担忧这种怀疑是毫无根据的，因为即使是最负盛名的专家也难以把握瞬息万变的形势。无论如何，在公众形象和科学修辞之间存在着明显的张力，尤其是在处理确定的数字和观点的转变之时该依靠什么、如何依靠和为何依靠的激烈讨论时更是如此。

我们进入了一个特殊的脆弱数字时代。2020年美国总统大选之后，特朗普继续“毫无根据地声称，大规模选民欺诈导致他失去连任资格，尽管这种说法已被法官、共和党和政府驳回”，但82%的特朗普拥趸支持上述声明。数字的脆弱性体现在公众对量化客观性的普遍质疑中。最近，在英国一项研究中，60%～70%的受访者认为“官方数据大多是准确的”，约75%的受访者认为政府官员和媒体的数据并不真实。这种对于专业知识量化模式的质疑在盎格鲁-撒克逊人文化中延续了好几代，却甚少像如今一样在政治文化上具有如此突出的地位，它可以在两个站不住脚的立场之间制造两极分化的对峙——对数字全然否定或全然认可。正如敢于和特朗普叫板的佐治亚州共和党州务卿布拉德·拉芬斯伯格（Brad Raffensperger）所说：“作为工程师，我一生都遵循一个座右铭，数字不会说谎。” ^[1]

目前，定量知识正处于一团混沌之中。前文所述的“两种文化”知识层级仍然存在，数字信息的威权就是表现之一。量化指标依然无处不在，监督绩效，给个人和组织进行分类和排名，影响政策的制定，塑造文化愿景。同时，量化指标的权威面临着近代以来更加多样化的持续挑战，在政治领域更是如此。

公众的怀疑和指责定量的去语境化与去历史化的原始批判背道而驰，使得事情更加错综复杂。原始批判的主要论点是，人们应该带着对历史、筛选和意图的认知，结合具体环境解读数字。这种结论似乎已经被政治化的怀疑主义所淹没，这种怀疑论调主张如果不喜欢数字得出的结论，就忽略它们，如有必要就编造数字取而代之。许多官员宣称自己“相信科学”，暗示数字具有客观的表面价值，从而反驳拉芬斯伯格式的怀疑论。这种观点忽略了原始批判，夸大了科学的价值。随着新冠病毒的传播，科学难以避免的失常和模糊暴露无遗，基于科学的政策建议也难免发生规律性波动。支配和掌控信任，同时作为公共决策基础的数字是否会一直像现在一样摇摇欲坠？难道我们一直以来所忧虑的“量化暴政”是毫无必要的吗？我们能否重新将原始批判与公众怀疑联系起来，或者需要用新的学术观点来取代原始批判？

随着大数据时代的到来，解决上述种种问题显得更加急迫。大数据代表着伴随专业知识新模式而来的全新知识体系。社会学家威廉·戴维斯（William Davies）认为，新型的定量分析通常是非公开的，而且缺乏“固定分析范畴”（fixed scale of analysis）和“明确的分类”（settled categories）。

我们生活在一个用以前所未有的速度和敏感度，追踪和分析我们的感受、身份和归属的时代。然而，这种新能力尚未得到足够的公共关注和论证。现在为谷歌和脸书服务的数据分析师不是专门生产数据以及被谴责的对象。相反，新型数据分析师隐匿在数据之后，他们的工作具有高度的保密性，赋予了他们超越社会科学家的政治影响力。在政治上实现统计逻辑到数据逻辑的转向具有深远的意义，使其在民粹主义抬头的时候得以完美自洽。民粹领袖或许对经济学家和民意调查专家不屑一顾，却对另外一种形式的数字分析言听计从。政客们依赖低调的新精英群体，他们在庞大的数据库中寻求规律，却甚少发表公开声明，更别提公布任何数据了。这些分析师通常是物理学家和数学家，他们的技能根本不是为社会研究而培养的。

随着大数据技术渗透到警务、教育和医疗等公共服务领域，随之而来的针对囚犯、教师和患者的新型数字权威或许会改变民众与国家互动的模式。当前大众倾向于强调过于依赖算法解决方案所导致的无力感和任意性，算法方案和受训专业人员的方案不一样，后者自身带着偏见。而结构性的歧视一旦纳入算法，则有可能无从纠正。例如，美国的种族歧视可能会被纳入算法，而算法作为专门的商业机密使得这种歧视难以纠正。这种趋势是否标志着伊丽莎白·查特吉（Elizabeth Chatterjee）在本书第一章所称的“数字统治”复兴？我们是否已经迈进全新领域，在此领域中量化的实力日益强盛，对于量化的质疑不断弱化？

这就是本书研究的切入点。我们一方面接受原始批判的观点，另一方面另辟蹊径了解在当前的政治和知识时代，数字应该如何在政治和社会生活中发挥作用。在2015年到2019年间，来自芝加哥大学、剑桥大学和加利福尼亚大学圣巴巴拉分校的三个团队，着手研究气候、健康和高等教育三个领域量化的历史和现状：芝加哥大学项目分析了数字预测和目标在解释气候现象和规划气候治理中的作用；剑桥大学团队致力于从更加宏观的视角研究数字在健康监测、医疗效果和社会福利等领域的作用；圣巴巴拉大学团队研究了教研领域成果的量化，对高校的教学成果评估进行了探讨。尽管在研究这些复杂案例时颇费了一些功夫，也尚未完全达成共识，我们还是从中找到了两个关键的研究切入点。

其一，我们很容易把量化和指标的发展混为一谈，认为它们都是单一的同质事物，但这是错误的。“数字”作为一个概括性的术语，涵盖着许多截然不同的实践。用于衡量发展水平的复杂指标体系，例如联合国人类发展指数（FDI）、可持续发展目标或英国国家统计署的国民福祉衡量指标（详见第八章）是数字化的，但是它们在概念上和传统效益分析（CBA）有所差异，虽然后者也用数字表示。联合国人类发展指数（FDI）和效益分析（CBA）的支持者也是数字化的，他们都在寻找简单且易于管理的数字来取代国内生产总值。人类发展指数完全建立在亚里士多德关于存在和行为方面福祉的描述上，和效益分析的功利主义观点有所不同：后者试图通过愉悦或偏好程度来衡量所有价值，反映了其对于人类发展指数方法的厌恶。我们一开始以为把这些案例放在一起研究可能会有所帮助。实际上，当我们对它们采取相同的评估方法时，才发现应当将其区别处理。从表面上看，不同的统计数据，例如第八章的幸福感或第九章的教育价值，看起来都是量化的，这些数据的概念基础却截然不同，虽然这些基础都已经摇摇欲坠。在探究数字之间的差异时，我们发现选择数字技术的理由相互交织，错综复杂，因此需要对“定量”进行更加明确的定义以及更加精确的批判。

其二，原始批判建立在福柯（Foucault）观点的基础上，旨在阐明权力和量化之间的关系。然而，我们都对和原始批判唱反调、强调数字如何化无形为有形从而挑战既得利益的研究感到印象深刻。该研究讲述的是通过数字挑战既得利益的方法，其中一个方法就是化无形为有形。这种传统起源于法国，其中最具代表性的是法国经济学家托马斯·皮凯蒂（Thomas Piketty）的主张“拒绝和数字打交道不符合最贫困者的利益”。或许最强烈和明显的统计主义（即滥用数据的狂热行为）通常见诸通过定量工具评估工业发展对于环境影响的气候科学领域。美国最富有的1%人口占有的财富比所有中产阶级加起来还要多，这一惊人结论可不是空穴来风，其背后有定量数据支撑，推动了占领华尔街运动。数字可以用来掩盖权力运作，也可以用来挑战权力，推动和革新政治运动。在政治决策的诸多领域，我们有充分的理由用量化措施和目标取代“专家研判”，因为专家观点往往是偏见，披着自私的外袍。坚持在认知和伦理层面正确的专业判断虽然是浪漫和理想主义的，事实上却毫无裨益。正因为数字并未凌驾或超越政治，因此可以出于不同目的被重构，问题不在于量化本身，而在于量化的用途。数字可以用于问责，前提是数字对民主制度负责。

所谓知易行难，数字问责制度该如何施行？最近，人们用原始批判来解决这个问题。2010年以来，我们经历了数字问责的第二次浪潮——凯茜·奥尼尔（Cathy O’Neil）、弗兰克·帕斯夸莱（Frank Pasquale）、莎莉·安格尔·梅里（Sally Engle Merry）、温迪·埃斯普兰（Wendy Espeland）、迈克尔·尚德（Michael Sauder）、大卫·尼伦伯格（David Nirenberg）和里卡多·L.尼伦伯格（Ricardo L.Nirenberg）已经迈出了关键一步，深化了认知和道德层面的问责指标。在此背景下，本书对于数字同时作为认知和社会问题的研究做出了几大贡献。

第一，我们对量化下了一个更加狭隘和精确的定义：

量化就是运用前所未有的数字表述来描述现实或影响变化的行为。

该定义肯定了数字的描述功能和积极作用，表明量化是一个必须结合目标、背景和历史来理解的连续过程，而且不像其他定义那样限制量化的范畴。 ^[2]

第二，我们从上述矛盾或至少自相矛盾的地方开始研究。在这些地方数字和指标更具影响力，同时也更加脆弱。数字的权威逐渐被弱化，竞争愈加激烈，自然更有争议。它们时而负隅顽抗（例如我们坚信人有五感），时而被弃之如敝屣。这似乎与非数字概念大不相同，后者更加深刻地影响着我们的世界观并通过更大的转变来应对挑战。

第三，根据对不同类型量化的理解，我们对医疗保健、气候科学和高等教育三个领域进行了案例分析研究，认为从一般历史现象的叙事转向特定案例的叙事（或批判）时不宜太急，应该徐徐图之。毕竟，数字经常游离于自己的诞生之地，进入全新的领域是数字叙事的关键特征之一，也是本书研究的重点。在第六章，斯蒂芬·约翰追溯了“一天五次”这个数字是如何从世界卫生组织的报告到国家卫生政策的历程。数字一旦被运用，会失去原有的一些特征，也获得一些新的特征。宏观趋势或许能显示数字会变成什么样，却不一定能预测这些数字会变成什么样、具体如何展开，又或者预测这些变化是否是不好的、是问题丛生的。

第四，我们试图厘清数字的历史和社会构建性。 ^[3] 眼下毋庸置疑的是，我们计算的内容、形式和原因总是受到价值和利益的影响，但至少和我们正在计算的东西性质一样。这只能作为研究的切入点之一，而非再次研究的对象。

第五，我们通过显性的构建主义呼吁（重新）使用数字而非将其拒之门外。通过案例研究，我们更加坚信该领域的研究重点亟待改变，这很大程度上是因为引用标准和高校满意度评级等明显的量化错位招致了大量攻击。数字和指标的紧密结合会产生更加令人惊叹的效果。广而论之，我们坚信当人文学者深刻地理解量化局限性而非断然抗拒甚至无知无觉时，他们的声音和批判更有价值。

量化的异质性、目标、效果和用途应该使我们对包罗万象的数字理论保持怀疑的态度。这就是本书通过案例分析对量化进行研究的动机。同时，我们希望加深人们对于量化作为核心的认知、科学和社会进程的理解，拓展量化研究路径和数字在定性实践中应用的理解。

应该如何从个案研究转向一般性研究？为了回答这个问题，我们将支持和反对量化的观点放在一起进行直观的比较，综合现有文献和本书各章节的研究得到表0.1。在表格中，我们有意将一系列的量化实践——学术中的计量分析、科学中的测量、政策服务中的度量和政治领域的政绩统统放在量化的范畴中，旨在通过此表明确指出有必要克服原始批判轻右翼而重左翼的倾向（重申前述的本研究第五个特征）。这并不是说本表格采用的是本杰明·富兰克林（Benjamin Franklin）式“道德演绎”权衡利弊的方法。事实上，任何类似的尝试都有可能受到像表格左边栏目那样的批判。我们也知道许多支持或反对量化的观点本身就是基于颇具争议性的道德或政治理论，例如罗尔斯模型中的公共协商模式。我们希望大家带着目的和批判使用这个表格。例如，对幸福感衡量指标感兴趣的人机敏地意识到如果缺乏度量美好生活的问卷或指标，人们有可能会质疑国内生产总值的可信度，也许会因此引发对国内生产总值的辩论。心系教育和医疗事业，对该两个领域衡量指标随意性保持怀疑态度的人们也该意识到监督官员确保他们对选民负责的目标是不可能实现的，因为在现代社会中面对面辩护的情形不大可能发生。

本书各章节的案例探讨了上述种种复杂现象。表中汇总的一般性词汇使我们得以摆脱对好坏数字过于粗暴的区分。认知上有问题的数字可以发挥对社会有益的作用，而认知上合理的数字反而做不到。表0.1展示了对量化的批判和辩护。

表0.1 对量化的批判和辩护

即使新冠病毒的再生数计算存在不确定性，该数字还是将人们的注意力集中在感染人数的指数增长上。其对新冠死亡病例的精确估量在认知层面无可挑剔，在激励变革方面却远没有人山人海的医院照片管用。有时候我们需要让数字更加直观，例如，把在新冠疫情中的死亡人数和“9·11”事件或者越南战争的死亡人数作对比。在书中我们探讨了在评估量化的局限性时，应该同时关注认知和实践维度，认识到它们之间看似理所当然的关联如何通过其所处背景实现，而且应该视不同的情况采取不同的方式。

现在我们来到本书的第六个重点，那就是致力于推导一个中级或中档的数字理论。我们所提出的既不是通论，也不是零散案例的集合。我们试图对数字进行分类，因为对数字的认知和批判，有可能因为种种原因变得含糊不清。当我们因为某些指标有用而使用它们的时候，有可能会因此制造不当激励，从而破坏指标的效度。这正是希瑟·史蒂芬（Heather Steffen）在第三章讲述的学习成果评估作为高校资源再分配以提升排名手段的叙事。最初，数字只是价值目标的表述，现在却因为实践受到了批判。

从根本上来说，构建数字度量体系可能需要我们做出有争议性的价值判断，为了确保度量的合法化，这些价值判断往往是隐而不露的。例如，用一篮子标准商品的价格衡量通货膨胀。当经济学家决定将哪些商品放入篮子时，他们的选择（隐晦地）反映了对体面或正常生活所需的价值判断。在研究以上假设时，我们认为无论在认知还是伦理上都有充分理由关注通货膨胀措施。

当然，在某些背景下区分认知和实践的关切点无可厚非，理论和实践之间可能存在着很深的分歧。我们试图在其中找到平衡，因为在这个点上诸多关切相互交织，可能会导致小题大做，任何简单的主张都变成大问题。

在整个引言中，我们一直强调数字的异质性和随之而来的量化形式多样性以及对量化的各种批判。诸位读者在摸索所谓“数字的局限”时或许会感觉迷惑不解，因为我们展示的其实是，我们自身分析框架的局限，那就是无数可分析。然而，这本身可能就是谬误的。显然，用数字描述世界的方式异于语言、图像、图形或音乐等形式。值得注意的是，数字表述更加容易受到规范分析的影响，因而带着常规科学客观特质。此外，它们能把迥异的事物等量齐观，对推理形式推陈出新。或许因为其他特征，可以跨越语言或文化边界，在某些辩论中获得权威地位，得以经常取代其他形式的判断和解读。我们并不否认这些特征，而是指出世界上没有哪一个叙事能把量化讲通透，讲明白量化的原理、优劣和影响。任何“一刀切”的叙事都显得过于笼统，反而无法囊括个例。究其原因，正如特伦霍姆·荣汉斯（Trenholme Junghans）在第四章中指出的那样，定性和定量并非对立，而是抽象概念的一体两面。定性和定量都试图减少在同一个标签下的现实成分从而变得更加抽象易于管理。因此，上述表格中许多批判大都是针对语言的。所有的表述，无论是数字还是其他形式，都是有选择性的。一个有趣的推论是，原始批判只是所谓的原始的批判（primordial critique）的变体，因为所有的表述都被扭曲了。我们更加希望强调的是隐藏的复杂价值判断，错位的专家判断和被歪曲的复杂现实往往正是我们所需要的！

本书的共同主题是方法论而非实质性的效用。我们不打算把量化分析的影响进行量化，也不会颠倒传统的层次结构，一味推崇定性的方法。相反，我们的研究表明，唯有跳出量化的框架，才能更加全面地了解量化的作用、原理以及效果。本书还展示了定性和定量方法交互的多种方式，即通过与历史、制度和哲学分析相结合克服或者至少克服部分数字的局限性。这种分析时而指示我们使用更好的量化方法，时而指示不要使用量化方法，时而没有规范含义，只是为了加深理解。数字指标往往和严谨清晰的概念相互关联。我们希望表明定性路径也可以采用严谨度不亚于定量的方法来探索数字的边界，在探索的过程中寻找更好的评估方法。

在项目刚开始的时候，基于大概的估计，我们说人们普遍认为量化手段在气候科学研究中是正面的，在高等教育研究中是负面的，在医疗保健研究中则是好坏参半。然而随着项目的发展，我们随即发现了叙事的复杂性、气候科学中核心数字的认知问题和弱点、学习成果评估效果的替代方案、解读异常健康指标意料之外的效果。通过和作者们历时三年的沟通讨论，我们逐渐了解到三个领域的共性和差异，以及这些领域在民粹主义兴起等重大政治转向中各自受到的影响。

因此，我们决定将三个领域合而为一，为读者们提供有着主题和维度的完整叙事。可以想象，读者们对于用数字来解决社会、文化和政治问题保持怀疑的态度，虽然这些做法十分普遍。他们或许会质疑通过评估平均生命质量调整年（QALY）花费来决定是否资助一项药物研制或者根据国内排名来选择大学的效果。他们或许会感谢关于二氧化碳水平的量化数据，因为这些数据有助于解释日益严重的气候不稳定性，同时质疑这些数据的准确性及其对公众舆论的影响，或者两者兼而有之。他们在使用数字做出关于健康、教育和环境生存的个人或政策决策时，或许带着废奴主义本能。如果他们把数字当作基本的经验数据，他们可能会坚持结合环境解释数据，并且让位于政治和哲学判断。简而言之，读者拿起这本书，希望看到数字正当其位，定性和叙事能作为定量的替代品。

本章的叙事线索对于读者们而言确实有些曲折。我们从所谓的民粹主义反抗事实、真理、专家和现实本身开始讲述，丝毫不会淡化威权领导和政治文化的崛起，尽管他们通常粉饰太平，仿佛他们嘴里说的就是大实话，也不会忽视他们打压反抗其意志的个人和机构这一行为的严重性。第一章的作者伊丽莎白·查特吉和第二章的作者克里斯托弗·纽菲尔德认为，专家们应该对专业定量知识的名誉受损负责。使用脱离现实的数字而忽略社会成本的后果，就是新的匿名数字在民粹主义的复兴中以复仇者的姿态卷土重来。英国和美国的专家正在为割裂量化主张及其动机和影响付出高昂的代价。类似趋势可以很好地解释其他国家事态发展。将数据放在相关背景中，承认鸿沟和不确定性的存在，维持公众信任度，或许是我们面临的最大挑战。

把数据从背景中剥离会造成一些问题，解决这些问题最合理的方法就是把数字放回背景中。在接下来的三章中，我们将探讨用叙事来进行数字纠偏，利用人文学科优势更好地运用量化手段。正如第三章的作者希瑟·史蒂芬所述，回归定性实际上是对现存定量主张的确认以及合理化，目的是提升其可接受度和用户友好程度而非改善结果。在她的文章中，教学评估者主宰着教学环境并且强加威权主义的评价。一旦评估者创造了评估环境，所有的问题都会重塑，解决方法尽在评估者手中，定性和定量的运用都出于同一个目的。回归个体叙事也反映出企业的操控和证据标准的降低。正如特伦霍姆·荣汉斯在第四章中写道，定性叙事有其自身的真实性光环，这和数字所散发的客观之光一样具有欺骗性。在第五章劳拉·曼德尔（Laura Mandell）的研究中，叙事可以改变和改善数字程序，但主要（也可能仅是）发生在数字程序深入险境时，也就是到时候公然将调查人员的主观性引入调查，而非杜绝其主观性。此举使定性实践同样遭受了人们对定量一样的批判。主观性是定性分析赋予数字的核心力量，也是难以避免的。

考虑到潜在的风险，我们认为有必要尝试另外一种策略，即接受数字解释结果（如果有），专注于优化数字本身。从根本上来说，数据质量非常重要，因此调查人员有义务收集优质数据，采用最好的分析程序，并时常对分析程序进行回顾与批判，不断努力改进。好数字不能保证好结果，同时好结论不一定需要好数字（参见第六章和第七章）。

作为本书的编著者，我们肩负着双重义务。首先，我们需要参与数字程序而非接受既定的结果。这意味着把定性学科沉浸在数字中，这些学科因而需要拓展定量技能。其次，我们需要接受意义解释框架对数字的影响，只有当数据和解释框架都准确精密，而且调查人员对于它们的关联细节处理得当，全球性的核心问题才能通过定量的方法得到妥善的解决。

在第九章中，格雷格·卢斯克（Greg Lusk）阐述了量化极端天气影响的多视角道德思维：相同的数字可能对问责制和受害者的赔偿产生截然不同的后果。安娜·亚历山德罗娃和第八章的作者拉曼迪普·辛格（Ramandeep Singh）以及阿什什·梅塔（Aashish Mehta）和第十章的作者克里斯托弗·纽菲尔德的研究都阐述了这么一个观点：即使调查员承认他们的数字可能没有触及“真正的东西”，即使虚假的指标在实践中被合理化了，关于“真正的东西”的概念性工作仍然是必不可少而且是可以实现的。

本书对重大历史时刻的知识分析有所贡献。双文化层级制度的功能失调无论在理论还是实践层面都显而易见。目前，我们仍然缺乏促进两种文化互动的新范式。新冠疫情吹响了相信“科学”的号角，而人文学科则偏向了另外一边，这说明了旧范式的强大吸引力。科学上的不确定性引起了怀疑，同时也暴露了其自身的弱点。本书的各章节概述内容对于基于定性和定量之间认知对等的新范式都有所涉猎。这要求学者们对自身研究所处的知识体系中的社会和技术要素了如指掌，对于知识体系有明确的立场，为知识体系进行公开辩论，从而促进知识体系的革新。希望本书能为这项复杂的全球性工程做出自己的贡献。

[1] 《佐治亚州州务卿证实乔·拜登当选总统》（ Georgia Secretary of State Certifies Election for Joe Biden ），PBS NewsHour，2020年11月20日。

[2] 将此定义与莎利·安格尔·梅里（Sally Engle Merry）在其著作《量化的诱惑》（ The Seductions of Quantification ）中的定义进行比较：“量化，我指的是以可靠和可衡量的方式，运用数字来描述社会现象。”梅里的定义提及了可衡量是量化的一个关键特征。该定义涵盖了许多实践：设计指标和推理技术，收集和表示数据，将它们嵌入现有或新机构中，以实现控制、治理以及可视化的目标。该定义对于原始批判的作用很大。学者们能根据定义找到进一步分析所依据的有趣事实和共性。例如，量化的动力并非源自对拥有物理学特质的渴望，而是源自对于公平和善意的需求。即使量化失败了，也能自我复制。然而，它将所有的量化实践都归结为计算，从而忽略了一个事实，即数字显然是重塑世界的一种方式，而非计算已经存在的事物。为了呼应以上作者们的关切，我们希望强调量化有着明确的目标，旨在改变和描述变化。复杂的是只有当数字现实为基础时，它们才能改变世界。

[3] 简而言之，我们在研究数字的过程中发现了四对区别。
（1）序数与基数。序数仅用于按升序或降序排列项目，而基数表示项目的区间。长期以来，经济学和心理学在关于效用和影响等量是序数还是基数上争持不下。虽然两者都是数字，但只有基数才能进行计算平均值，确定系数和比较差异等的重型量化。仅包含次序信息的序数无法进行此类操作。在社会背景下，有些数字是序数，例如生活满意度和教学质量；有些是基数，例如选票和国内生产总值。人们总是倾向于把序数视为基数。尽管从理论专家的角度来看这是不合理的，但是超脱于现有证据的数字主张却很常见。在第八章亚历山德罗娃和辛格的研究中举例阐述了序数性的调查报告最终用于精准衡量政策对国家福利的影响。因此，这种区别对于理解数字如何负载超出其原始容量的信息大有用处。
（2）实证数字与虚假数字。数字代表着既定的现象。然而，人们有时会采用虚假精确的数字，因为它们能提供比证据本身更加准确的表述。人们有时会带着恶意，通过投机取巧的方式使用虚假精确数字。有时候是因为出于无论如何必须要拿出一个数字的压力才出此下策。这种压力可能来源于对协调、沟通或问责的需求。数字的协调作用多见于饮食（第六章）、经济（第一章和第二章）和医疗（第七章）等领域。数字在社会和政治中的作用/效用足以说明它所扮演的两种角色之间具有更深层次的张力：呈现事实和开展协调。在构建固定的测量系统时，比如标准千克或一蒲式耳（英美制计量单位，1蒲式耳约36.37升）玉米的多少，意味着我们正在构建描述世界和协调社会的新方式。
（3）学术数字与管理数字。有些数字的援引用于表述世界，另外一些用于改变世界，无论是通过鼓励、激励还是规范受众行为实现目的。人们通常将学术和科研数字与学术数字联系起来，把政治、政策和商业领域的数字和管理数字联系起来。然而，这种分类是一种简化。学术上的数字通常嵌入语言行为中，对听众的行为产生影响，管理者必须以实践为基础。一个非常明确但不可实现的目标相当于没有目标。然而，根据数字的首要或预期功能来区分数字，是理解数字的成功和适应性或有不同的关键。史蒂芬（第三章）、约翰（第六章）和卢斯克（第九章）分别展示了上述区别如何在教育、营养政策和气候科学中的作用。
（4）压迫性数字与解放性数字。除了上述三个区别，第四个区别强调了这么一个现实，即无论数字是基数还是序数、实证还是虚假、管理还是学术，它们既能推动进程，也能阻碍发展。原始批判（连同威斯坦·休·奥登发表在1940年的诗歌《无名公民》和其他许多作品中）展示了统计数据的同质化、去个性化、剥夺判断和自发性以及操纵等特质。正如统计学家所展示，正确的数字具有动员、揭发不公、发声和代表的力量。有人将数字的双重角色解读为中立性（数字只是工具，数字被使用之后才能对其进行评估），我们更多地看到人们用基于经验的创新方法运用各种数字，而非仅仅通过历史数据进行预测。数字部署道德效价的变化可见于巴达诺关于质量调整寿命年（QALY）在资源公平分配中作用的叙事（第七章）以及亚历山德罗娃和辛格对渐进式福祉的量化演绎（第八章）。上述区别帮助我们实现了量化标准定义的转向。

引言 数字角色的变迁

引言
数字角色的变迁