自有记录以来,巨大的数据缺口占据了人类历史的大部分。从“作为狩猎者的人类”(Man the Hunter)理论开始,编年史家几乎没有为女性在人类演化中扮演的角色留下什么空间,无论是文化还是生物学意义上的演化。相反,男性的生活被用来代表全体人类的生活。而在谈及另一半人类的生活时,通常只剩沉默。
这种沉默无处不在,遍布我们的整个文化:电影、新闻、文学、科学、城市规划、经济学。我们向自己讲述的那些关于过去、现在和未来的故事,全都扭曲了,被打上了女性“缺席”的标记。这就是性别数据缺口。
性别数据缺口不仅仅关乎沉默。这些沉默、这些缺口,皆有其后果。它们每天都在影响女性的生活。这种影响可以相对较小。例如,女性在办公室里瑟瑟发抖,因为空调温度是按男性的体温标准设定;或者伸手够货架顶端十分费劲,因为货架是按男性的身高标准设计。让人恼火吗?当然了。是不是不公平?毫无疑问。
但这些事还不会危及生命。除非你出了车祸,而汽车的安全措施在设计时又恰巧没有考虑到女性的身材;或是你的心脏病未能确诊,因为症状被视为“非典型”。对这些女性来说,生活在一个以男性数据为基础的世界里,后果可能是致命的。
论及性别数据缺口,最重要的观点之一是它通常不带恶意,甚至并非有意。事实恰恰相反:性别数据缺口完全是一种存在了数千年的思考方式的产物,因此也可说源于不思考。双重的不思考:男人不言而喻,女人不被提及。因为当我们说到人类,总的来说,我们指的是男人。
这不是什么新发现。西蒙娜·德·波伏瓦在1949年写下了著名论断:“人类是男性的,男人不是从女人本身,而是从相对男人而言来界定女人,女人不被看作一个自主的存在。(……)男人是主体,是绝对,而女人是他者。” [1] 要说什么是新的,那就是女性继续作为“他者”存在的环境,而这一环境即我们所处的世界越来越依赖和受制于数据。尤其是大数据。反过来,大数据又在大计算机里接受大算法的筛选,以便筛出大真理。但当你的大数据被巨大的沉默所破坏,你得到的真相就只是半真半假。而且通常对于女性来说,它们根本就不是真的。正如计算机科学家自己说的:“垃圾进,垃圾出。”
这种新环境令消除性别数据缺口的需求更加迫切。辅助医学诊断、筛选简历甚至面试潜在求职者的人工智能已经很常见。但是训练人工智能的数据集充满了数据缺口——而且由于算法通常被当作私有软件且受到保护,我们甚至不能检查这些缺口是否被考虑在内。不过,从现有的证据来看,显然是没有。
对这本《看不见的女性》来说,数字、技术、算法都至关重要。但它们只讲述了故事的一半。数据只是信息的另一种说法,而信息有很多来源。没错,统计是一种信息,但人类的经验也是信息。所以我认为,当我们设计一个为所有人服务的世界时,我们需要女性在场。如果那些对我们所有人产生影响的决定,都是出自身体健全的白人男性(九成来自美国),那也会形成数据缺口——就像在医学研究中不收集女性身体信息会形成数据缺口一样。正如我将展示的,女性视角的缺席恰恰大力驱动了一种无意识的男性偏见,而这种偏见还试图(通常是善意地)假装自己“性别中立”。这就是波伏瓦所说的,男人把自己的观点与绝对真理相混淆。
女性特有而男性不会纳入考量的问题涉及众多领域,在阅读本书时,你会注意到三个主题反复出现:女性的身体、女性无偿看护的负担和男性对女性的暴力。这些问题如此重要,触及我们生活的几乎每一个部分,从公共交通到政治,从工作场所到医院手术,影响我们方方面面的体验。但是男人忘记了这些问题,因为男人并不拥有女人的身体。我们还会在书中看到,他们所做的无偿工作只是女性的一小部分。而且,虽然男性同样不得不与暴力做斗争,但他们面临的暴力与女性面临的表现不同。这些差异均被忽略,而我们熟视无睹,仿佛男性的身体及其伴随的生命体验是中性的。这是对女性的一种歧视。
在本书中,我将提到生理性别(sex)和社会性别(gender)。我所说的“生理性别”是指决定一个人是男性还是女性的生理特征,即XX和XY染色体。所谓“社会性别”,是指我们强加给这些生物学事实的社会意义——女性因为被视作女性而受到的对待。社会性别是人为的,但两种性别都真实存在,都对在这个以男性数据为基础的世界里生存的女性至关重要。
但是,尽管我自始至终都在同时谈论生理性别和社会性别,我还是将社会性别数据缺口作为主导术语,因为生理性别并不是女性被排除在数据之外的原因,社会性别才是。通过列举这么多对女性造成巨大损害的现象,我想弄清根本原因。而且,与你将在本书中读到的许多说法相反,女性的身体并不是问题所在。问题在于我们给这具身体赋予了社会意义,且无法从社会层面为之负责。
《看不见的女性》是一个关于缺席的故事——所以有时很难写出来。如果说在总体上女性数据存在缺口(这既是因为我们一开始就没有收集数据,也是因为当我们收集数据时通常不会按生理性别进行区分),那么论及有色人种女性、残障女性、劳动阶层女性时,数据实际上根本不存在。这不仅仅是因为没有人收集,也是因为它们没有从男性数据中分离出来——也即所谓“按性别分列的数据”。从学术工作到电影角色,在代表性统计当中,“女性”和“少数族裔”的数据可以被分别列出,女性少数族裔的数据却消失在更大的分组中。但凡存在这种数据,我都会一一列出——可它们几乎从未存在过。
这本书的重点不是精神分析。我无法直接触及那些固化性别数据缺口的人内心深处的想法,这意味着本书无法为性别数据缺口为什么会存在提供最终证明。我只能向你们提供数据,并请各位读者阅读这些证据。但是,那些设计出带有男性偏见工具的人是不是隐性的性别歧视者,对这个问题,我也无意探究。在某种程度上,个人动机无关紧要。重要的是模式。考虑到我将展示的数据的分量,重要的是我们是否还有理由得出这种结论:性别数据缺口只是一个巨大的巧合。
我认为它不是巧合。我将指出,不假思索地将人类几乎仅视为男性——性别数据缺口既是这种思维方式的原因,也是其结果。我将展示这种偏见出现的频率和广度,以及它是如何扭曲那些日益支配我们生活、本应客观的数据。我将表明,即使是在这个超级理性的世界里,在这个日益受到超级公正的超级计算机主导的时代里,女性在很大程度上仍是波伏瓦所说的第二性——而且,和过去一样,依然有沦为男性的从属类型的危险,而这还是最好的情况。