



备受尊敬的已故参议员丹尼尔·帕特里克·莫伊尼汉(Daniel Patrick Moynihan)
来自纽约。他曾经说过一句著名的话:“每个人都可以有他自己的观点,但不可以有他自己的事实。”(Everyone is entitled to his own opinions,but not to his own facts.)
或许这正是美国总统巴拉克·奥巴马推行其第一个行政措施时的想法。奥巴马签署了“透明与开放政府”备忘录(“Transparency and Open Government”memorandum),要求各级行政机构“迅速以公众方便查找和使用的形式公开信息”。 36 两个月后,奥巴马任命的联邦政府首席信息官维维克·昆德拉(Vivek Kundra)宣布建立一个政府网站——Data.gov。行政部门需要公布所有不涉及国家机密的数据,以便公众可以获取——包括从农业部收到的转基因粮食许可证请求,到国家军人公墓管理部门(National Cemetery Administration)的客户满意度调查结果等所有的信息。最初Data.gov刚开通时,只有47个数据库。9个月过后,数据库达到了16.8万个, 37 总点击量为6 400万。 38
奥巴马的行政命令旨在建立——用软件行业的话说——一个新的系统设定值(a new default)。系统设定值是软件运行所需的选项组合;要改变设定值需要采取特殊措施,即使这些特殊措施就如同点击选择框一样简单。设定值是非常重要的,因为它决定着用户初次使用该软件的体验:如果设定错误,你将失去很多懒得去改变自己偏好、或者不知道存在针对他们的特定选择的用户。但是,设定值更为重要的意义是作为一种符号,告诉用户该软件到底是做什么的以及到底是如何运行的。以微软的Word软件为例,可以连续多页书写文本格式的文件,而不是海报或者宣传册,是它的设定值。乐之饼干(Ritz)的设定值,就像它的包装上描述的那样,就是注定要被人单独或者加上芝士吃掉。 39
在奥巴马的行政命令颁布之前,大多数政府数据的设定值是不对公众公开。环境保护署(The Environmental Protection Agency)过去常常会公布其高速公路里程测试的结果,但却并不公开此类测试所依据的是哪些数据。
自从新的设定值(即奥巴马的行政命令)实施以来,从环境保护署的数据网站FuelEconomy.gov上,人们可以下载一个关于里程测试信息的电子表格。在这个表格上,你不仅能看到一辆2010年产的普锐斯汽车(Prius)
在市内的油耗是51英里/加仑,还可以看到它全年的平均燃油费用是780美元,甚至还能了解它的“多点/连续燃油喷射”系统;就连现在还不存在的氢燃料电池汽车,你都可以找到相关信息。
40
开放政府的拥护者希望设定值的改变可以更容易追究政府责任,并且刺激那些利用政府数据的新软件应用的快速发展,就像过去美国地质调查和人口普查的数据被用在意想不到的地方一样。
昆德拉代表奥巴马政府推动了此次行政部门设定值的改变,其本意是为了体现出政府的角色和政府的本质,但同时也向我们展示了事实不断变化的作用和性质。FuelEconomy.gov网站可以向我们提供一百种的数据,但却没有诸如公路测试当天的周围环境温度,轮胎里空气的每平方英寸压力,或者月亮引力这样的数据,而它们却有可能对测试数据产生微小的影响。我们知道,我们可以再获取100、1000或者10000栏的数据,但事实仍会超出我们的数据电子表格。Data.gov网站提供的数据之多难以想象——我们可以回去测量堆积在一起的《战争与和平》——但也并没有让我们感到自己对世界的全貌有了更进一步的了解。这种可能,已经被数据规模的宏大性本身所阻止。
Data.gov和FuelEconomy.gov网站并非议会蓝皮书。它们没有设法去下定论。Data.gov网站及世界各地其他政府效仿建立的同类网站,世界银行公布的经济信息的庞大数据库,完整的人类基因图谱,数十亿星系的地图,Google图书提供的超过1 000万本书的全部内容,人们为地球上所有物种进行编录的努力,这一切都属于伟大的解放事实行为:让大量的事实作为一种研究资源能被任何人获取,但不带有观点或者目的。现在,这些公开的信息聚集常被称为“数据公地”(data commons),并且,它们正在成为那些没有特殊原因需要保密的数据的系统设定。
一些人认为此种解放事实存在潜在的危险性。比如,在Data.gov网站上线不久,开放政府的拥护者很惊讶地发现了一篇发表在一本自由主义杂志上的文章。该文章由著名的开放政府倡导者劳伦斯·莱斯格(Lawrence Lessig)
所写,是关于开放数据所存在的缺陷。在这篇题为“反对透明”的文章中,莱斯格警告道,让大量未经解释的数据公布于众,会引导有政治动机的操作者进行一些似是而非的联系:每当候选人接受一游说集团的资金并对该游说集团支持的法案投支持票时,此类操作者会宣称这就是此候选人受贿的证据。因此,这些未经解读的数据会进一步形成诘责的文化。(莱格斯的文章建议通过改革美国的选举财政流程来减少公民的玩世不恭。)
41
这是解放数据的第二个讽刺之处:可利用信息数量的大幅增加反而让我们比以往更容易犯错。我们可以随手获得如此多的事实,以至于失去了得出结论的能力,因为总是有其他事实支持其他的说法。比如,我在世界资源研究所从200个国家收集到的信息中找到了关于全球气候变化的数据,而你从欧洲动物群的物种分布的数据库得到了不同的数据。你不喜欢我的结论?在几秒钟内,你就能拿出事实证明你的结论。
知识的基础比以往更加难以钉牢。
不仅事实在论断中的作用发生了变化,事实的基本形式也发现了变化。我们可以把事实的近代历史区分为三个阶段(尽管真实的阶段划分起来要更为混乱)。
首先,是经典事实时期(Age of Classic Facts),代表是使用解剖工具的达尔文和议会蓝皮书。这些事实相对稀缺,需要付出较大努力才能发现,并且用于证明理论。
之后,在20世纪50年代,我们进入了基于数据的事实时期(Age of Databased Facts),以堆放在电脑主机旁边的打孔卡为代表。我们认为自己拥有了大量的信息,但要储存现在一个200G笔记本硬盘的信息,我们需要大约20亿张卡——这些卡堆在一起大约有300英里高。 42 因此,这个时代的数据库仍然要严格限制记录信息的数量:员工的姓名、出生日期、开始工作日期和社保号码会记录进去,但业余爱好和技能或曾居住的国家并不在内。数据时代依然遵循我们认识世界的古老战略,即限制知识——由部分人为我们选择和组织部分领域的知识。
现在,在网络时代(Age of the Net),只有谈论网络化的事实(networked facts)才说得通。如果经典事实和数据事实被看做是从根本上孤立的知识单元,那么网络化的事实则被认为是网络的一部分。网络化的事实存在于一个相互连接的网络内,如此它们才变得有用,能被人们理解。比如,在印刷时代,一篇科学文章里出现的数据表,只是众多没有被刊出的事实和数据的小部分摘录。而在现在的互联网上,科学杂志越来越多地将文章中出现的数据超链接到它们的源数据库中。比如,《科学公共图书馆·医学》(
Public Library of Science Medicine
)杂志
43
的一篇文章,通过对144 018次测试的分析,提出了试管内授精“婴儿安全出生的预测因素”。这篇文章就同时链接到了英国的开放政府网站——“世界上时间最长且最全面的英国生育治疗数据库”——文章中的源数据就是来自这里。
44
新的系统设定值是:如果你计划援引数据,你最好链接这些数据。网络化事实会指明它们来自何方,并且有时候会指明它们将去往何方。的确,一种被称之为关联数据(Linked Data)
的新标准正以前所未有的方式,令一个网站的事实也可以非常简单地为其他事实所用——从而使得一个特定目的的全球数据公地成为可能。关联数据的关键,是不仅仅让电脑程序获取事实,还要求链接以获得更多关于事实的背景信息。
45
事实之所以能变得网络化,是因为我们新的信息基础设施恰好是一个超链接的出版系统。如果你想让一个事实为人所知,你只需将事实与事实来源链接起来,就是这么简单,简单到除非你需要特殊的理由不让你这么做。但是我们的新网络不只是统一了信息和出版系统,它还将我们与其他人群联合起来。在环境保护署的汽车里程数据库中,普锐斯的51英里/加仑只是个数字。一旦那个事实嵌入一个有标签的表格里,它就会变得有意义。然后,当有人把表格放在网页上,它会变得更有意义。无论那个网页的观点是什么——普锐斯的里程油耗很棒,不够好,是弄虚作假——网络上某个网页都很有可能提出相反的观点。因此,网络化的数据“51”既向后指向了一个传统的数据库,也向前指向了不受控制的网络化讨论。这和我们过去一直接触事实的方式大不相同。我们看到的数据,不再是受到一个蓝皮书、一篇科学文献或者一本印刷书内的观点限制而单独前行的样子。我们看见事实被人们捡起来,摔到墙上,它们自相矛盾,分崩离析,被夸大被模仿。我们正在见证牛顿第二定律(Newton’s Second Law)的事实版本:
在网络上,每个事实都有一个大小相等、方向相反的反作用力
(On the Net, every fact has an equal and opposite reaction)。
这些反作用的事实可能错得彻头彻尾。的确如此,当事实真的是自相矛盾时,至少有一个事实是错误的。但是,这种持续的、支持多方的、每个事实相互连接的矛盾性,改变了事实的性质以及事实对于我们文化的作用。
当莫伊尼汉说出“每个人都可以有他自己的观点,但不可以有他自己的事实”时,我们听到的是:事实给我们提供了一个解决分歧的方式。但网络化事实开启了一个充满分歧的网络。我们可能会怀念过去的经典事实时期,但我们应该意识到,那个时期对事实的看法,并非基于事实而是基于发表事实的纸质媒体。由于纸张的经济性,事实是相对缺乏且珍贵的,因为纸质媒介没有版面发表全部事实。由于纸张的物理性质,一旦事实被刊印,它就永远留在了那里,没有自相矛盾,至少在那一个版面上如此。纸张的局限让事实看上去比现在更易控制,因为现在我们眼见着事实被链接进了一个不受限制的网络中。
当然,在一些重要领域,事实依然发挥着传统的作用,而且我们也没有打算改变这种状况——很多生命被挽救是因为乔纳斯·索尔克发现了一个证明他的疫苗有效的方法。现在,网络让我们发现事实,并且对事实追根溯源。然而,你在网络上花的时间越久,你就越能意识到在如此多的领域里,事实已经失去了其古老的作用。有人认为疫苗引起自闭症,有人仍然认为巴拉克·奥巴马来自肯尼亚
,有人认为政府隐藏了地球上有外星人的证据,这些人都有比以往更多的事实去证明他们的观点。当然,认为以上想法太疯狂(我也如此认为)的人也有更多的事实证明自己的观点。我们已经无比清楚地看到,在人们根深蒂固不可改变的观点面前,事实是多么地虚弱无力。我们有机会接触到比以往任何时候都多的事实,因此我们也就越发能够看到,事实并没有像以往我们利用的那样发挥作用。
我强调一点,事实的传统作用并没有从网络上消失。谢天谢地,科学家依然像以往那样发现事实。对政策的讨论中,人们依旧以事实作为得出结论的基础,尽管人们对于哪些事实相关以及如何利用它们,总是存在激烈的争论。重要的是,大路货的事实王国(the realm of commoditized facts)正在扩大,它由大的信念共同体(community of belief)认为毋庸置疑的事实所构成;同样也在扩大的是获取那些事实的渠道:任何能够上网的人都能得到匹兹堡人口的统计数,而且几乎不管出于什么目的,都会觉得这些数字足够可信。然而,如果你尽力去追究一个事实,总会发现有人在反驳它。你想利用事实去支持某个观点,然后你会发现很多链接指向那些和你有根本分歧的人。过去我们认为,所有人都可以对事实达成一致,继而能够达成一致的结论,但新的知识媒介(medium of knowledge)正在粉碎这样的乐观。确实,我们不得不思考,我们过去的乐观是否基于纸质出版固有的局限性:我们自认为我们在事实的基础之上建立了不可撼动的知识宫殿,但也许仅仅是因为那些大声疾呼的不同意见并没有被公众听到。
简而言之,尽管事实依旧是事实,但它们不再充当像参议员莫伊尼汉所强调的那种社会基石。
顺便一提,我们并没有十足的把握确定参议员莫伊尼汉真的说过“每个人都可以有他自己的观点,但不可以有他自己的事实”。他说的也许是另一个版本,比如“你可以有你自己的观点,但你不可以有你自己的事实”。这句话也有可能是詹姆斯·施莱辛格(James Schlesinger)
说的。参议员莫伊尼汉曾经说过那句话并不是一个众人皆知的事实。
我是从网上了解到这一点的。 46