购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

第四节

数据新闻“数据”内涵的泛化

数据新闻的根本“气质”不在于“科学”,而在于“开放”,数据新闻的“数据”内涵在数据新闻最初发展的十年间也悄然发生变化。本节首先从数据新闻的历史梳理出发,探讨开放数据运动与新闻业的“共生”(symbiotic)关系,探寻数据新闻“数据”一词的初始内涵,之后剖析“数据”内涵泛化的深层原因。

一、开放数据运动与新闻业的“共生”关系

数据新闻虽是一种创新的新闻样式,却不单纯是媒体的自发创新行为,它是新闻业与开放数据运动“共生”的结果,新的数据开放后由记者立刻进行分析并告知公众。 “共生”原指不同生物间形成的互利依存关系,笔者在这里用该词指代不同行动者之间形成的彼此依赖、互利相生的关系。

(一)开放数据运动与《卫报》的主动参与

在开放数据运动中,《卫报》是重要的推动者。《卫报》长期呼吁政府发布所掌握的数据,并发起“释放我们的数据”(Free Our Data)项目。 2006年3月,《卫报》技术部门发表文章《归还我们皇冠上的明珠》(Give Us Back Our Crown Jewels),要求政府资助或授权的机构,如地形测量局、水文局、高速公路局等,向公众提供免费的数据,并指出:“为什么政府部门不能像Google Maps(谷歌地图)或者Xtides program一样让我们很容易地获取数据呢?” “释放我们的数据”项目由此开始。《卫报》技术部专门建立了网站(www.freeourdata.org.uk)积极促进项目的展开。“释放我们的数据”项目体现了新闻媒体对开放数据的诉求,由此不难理解为何《卫报》能成为当代数据新闻的先驱和积极的探索者。如今,《卫报》在数据新闻后附上原始数据,公众可免费下载 ,体现出其对开放数据运动的持续支持。

西蒙·罗杰斯认为数据新闻将开放数据的洪流与新型报道相结合,它不只是分析数据,还要让数据可获得(available),并展示记者的工作。 《卫报》开办数据博客的主要目的之一在于向公众提供记者整理好的数据:

我们必须核查这些数据,确保它们是从最可靠的来源获得的最好的数据。过去它们会在报纸刊发的那一刻“活着”,之后就消失在硬盘中,在一年后数据更新前很少出现。所以我们与这个网站一同推出数据商店(Data Store)——一个我们发布的所有统计数据的目录,向所有人开放这些数据。每当我们遇到一些有趣的、相关的或有用的东西时,我们都会把它贴在这里,告诉你我们打算用它做什么。

(二)开放数据推动者对新闻业的支持

在开放数据运动中,阳光基金会、奈特基金会、开放数据研究院、数据透明推广联合会等组织发挥了巨大的推动作用。这些组织不仅为想要运行开放数据项目的政府提供指导,还提供关于开放数据使用的工具、建议、课程和认证。 由于将“数据”视为生产知识的前提,开放数据推动者将开放源代码的理念扩充至原始数据分享,以实现“信息民主”(democratization of information),让更多的人参与政治。同时,开放数据推动者意识到他们要成为公众的数据中介者,将原始数据提炼成知识提供给公众。 尽管“信息民主”是为了让每个人都有解读原始数据的权利,但是开放数据推动者也意识到,一般人没有时间和专业知识做到这一点,要想实现“信息民主”,单纯依靠自身能力不太现实,还需要自身之外的中介。

在开放数据运动中,开放数据推动者对中介的选择标准有三个:(1)数据驱动:该中介应该能够处理大量复杂的数据集给他人。(2)开放:该中介能将数据通过故事或应用程序送达受众,从而将分享的数据应用。(3)参与:该中介能够积极地让公民参与公共议题,中介不仅是信息提供者,也应与受众有合作关系。 符合这三个标准的是非政府组织和专业记者,于是开放数据推动者尝试与之合作。

对于媒体而言,专业技能的培训和数据处理能力的提高需要资金和人力投入。开放数据虽好,却不一定能纳入媒体的日常生产实践中,开放数据推动者的介入为数据新闻实践注入了动力。如The Knight-Mozilla Fellows Ship项目的合作媒体包括《纽约时报》、《卫报》、《华盛顿邮报》、ProPublica、Zeit Online、BBC、半岛电视台等。这些媒体也成为当前全球数据新闻实践的先锋。

“维基解密”制造的一系列“泄密”事件构成了开放数据运动的另一部分。在2010年“维基解密”事件中,朱利安·阿桑奇与《卫报》《纽约时报》《明镜周刊》合作,推出了《伊拉克战争日志》和《阿富汗战争日志》。阿桑奇认为:“如果媒体真能投入资源分析报道两套日志,定会推动信息公开自由的根本大业向前发展。当时我唯一真正的工作就是与媒体合作,从材料中提取精华。其实这还不是唯一的工作:我还要监督他们的诚信。谁知很快这就变成了我的全职工作……” 现在“维基解密”已经与全球50多个国家和地区的80多家新闻机构建立了合作关系。

美国记者克雷格·斯沃曼在《维基解密是如何转包核查的重任》的文章中写道:“如果这些数据由‘维基解密’直接在自己的网站上公布,可能人们关心的焦点是它的真实性。当三家传统媒体在提炼出真实有用的数据,并在此基础上讲述故事时,人们才有可能去思索其中的政治内涵。”

在开放数据运动中发挥重要作用的奈特基金会2015年9月向美联社资助40万美元用于支持公众对关键信息的获取和数据新闻方面的建设,扩大了美联社与美国国内数据新闻团队的合作,并将其作为数据新闻最佳实践案例《2017年美联社手册》(2017 Associated Press Stylebook)加以推广。

所以,数据新闻扩散中有开放数据推动者的推动,数据新闻业者并非完全主动拥抱数据新闻,而数据新闻实践不仅宣传了开放数据运动,也成为开放数据运动的有机组成部分。西蒙·罗杰斯认为:“现在仍有大量的数据没有发布,我们正好充当了数据开放进程的加速器。”

二、对数据新闻“数据”泛化的可能解释

在数据新闻的全球扩散中,一个值得关注的现象是,数据新闻的“数据”内涵正在失去它原本的“开放数据”本义。全球数据新闻奖将“开放数据奖”奖项单列,也说明开放数据并不是目前所有数据新闻的“标配”,人们更倾向于从数据科学的层面理解“数据”的内涵:既包括开放数据,也包括其他各类数据。数据新闻的“数据”内涵已经被泛化,究其原因,主要有两点。

(一)数据新闻业者对数据新闻接纳的不同动因

数据新闻是一个未经深思熟虑定义的多义术语。 假如西蒙·罗杰斯当初将数据新闻命名为“开放数据新闻”,或者将数据新闻界定清楚,或许就不会导致当前学界、业界的“众声喧哗”了。当然,这只是假设。

2008年12月,当西蒙·罗杰斯提出数据新闻时,数据新闻只是《卫报》的一种创新实践,没有知名度。有观点认为,新闻生产发展的两条线(图表使用、数据获取与分析)在21世纪的最初十年一直在发展,但被新闻领域的其他技术发展“遮蔽”了。在2010年“维基解密”事件中,《卫报》的《伊拉克战争日志》以数据新闻的形态创新了报道方式在世界范围引发关注。英美主流媒体由此掀起了数据新闻发展的第一波大潮。 数据新闻的概念在“维基解密”事件之后被频繁提及。

当《卫报》的数据新闻受到业界关注时,人们更容易从数据新闻的外在形式上去认识、理解它。数据新闻的外在构成是“数据+数据可视化”,在对数据新闻的“直观”认识中,数据新闻诞生的语境被抽离,“数据”的内涵被忽视。或许“数据”的内涵在学习者眼中也并非是个关键问题。作为一种新闻实践,学习者更关心怎样学习和实践,而非它是什么。这就涉及数据新闻业者在实践中接纳数据新闻的动因问题。总体看,数据新闻业者接纳数据新闻主要基于“新闻责任”和“新闻创新”两种动因。

数据新闻的兴起与西方社会的民主传统息息相关,与开放政府的主张和行动相联系,遵循调查性报道为公众服务的传统。 在西方,数据新闻业者将数据制作成“可浏览的信息”(glanceable information),让用户快速、本能地浏览数据新闻,成为对话的催化剂。 根据皮尤研究中心2015年的调查结果,65%的美国公众在过去一年内查询过有关政府的数据,其中56%的人认为开放数据可以让新闻界更全面地报道政府活动,53%的人认为开放数据可以让政府更负责任,49%的人认为开放数据可以提高政府服务水平。

在德国,数据新闻作为民主政治理想的推手出现,数据新闻提升着新闻业的生产水平,维护新闻业的专业声誉;在希腊,数据新闻起初是在开放数据时代下媒体服务公众的一种手段,随后又契合了希腊债务危机时期公众了解政府花费的需要,数据新闻业者扮演的是教授新的专业技能和信息研究方法的“导师”角色 ;在瑞典,开放数据较为充分,数据新闻被大部分主流媒体所实践

基于“新闻责任”的数据新闻与受众的关系是积极的。数据新闻重新确立了人们相信新闻业还在做调查报道和专业报道的信念。 数据新闻不只是一种修辞,而是对神圣事实的一种更有能力(权力)的逼近,是对社会共同体责任的更大担当和承诺。

在开放数据程度并不高的国家和地区,数据新闻实践多基于“新闻创新”。马来西亚记者法马(Fama)认为,尽管在马来西亚在线数据越来越多,但是数据新闻实践不尽如人意,并未被大部分媒体采用,记者只报道老板和政府告诉他们的事。 驱动中国数据新闻实践的因素主要有商业考量和专业诉求,与英美迥异的发展背景在一定程度上限制了中国数据新闻在社会民主政治中的作用。 有研究者对国内数据新闻的早期实践者进行深度访谈发现,“他们之所以冒出做数据新闻的念头,就是因为受到国际一些前沿媒体的影响,如英国的《卫报》和美国的《纽约时报》等均是他们学习的对象。对数据新闻的采纳主要是基于特性的模仿” 。这也就不难理解国内数据新闻实践为何将重点放在“可视化”上,而非“数据驱动”下极具专业性的量化报道和深度报道。

(二)开放数据不足以支撑日常数据新闻生产

数据新闻使用的数据一般具备两个特点:一是涉及公共利益,二是具有新闻价值。开放数据运动的假设是政府将数据开放可以形成一个良性的循环:政府开放的数据越多越广泛,社会创新成本(如避免数据重复收集)和风险就越小;数据利用者的能力越强,数据利用效果就越好,创造的价值也越大,如此一来,又促使政府开放更多更广的数据资源。

在与开放数据运动“共生”的数据新闻实践中,政府开放数据的程度不深会阻碍数据新闻实践的推进。 现在大量的政府数据集仍掌握在行政体系内部,未能及时提供给社会利用 ,存在数据条块分割严重、数据平台缺乏统一标准、一些数据资源丰富的部门不愿共享等问题 。2016年的《全球数据开放晴雨表报告》(Open Data Barometer)显示,纳入评价的92个国家和地区都发布了政府的一些数据,在抽查的1 380个政府数据集中,只有10%是完全开放的,而开放的这些数据集还有很多存在质量问题。

在《全球数据开放晴雨表报告》中评分最高的英国,很多数据也是静态数据。以访问量最多的道路安全数据为例,在2015年9月只能检索到2013年及以前的完整数据,2015年上半年和2014年全年的数据均未发布。 所以在开放数据程度较高的英国和美国,数据记者很多时候需要通过《信息自由法》申请所要数据。

当开放数据无法满足数据新闻的日常生产时,对于数据记者而言,将“数据”边界拓展是一个可行的策略。随着大数据时代的来临,对海量非结构化数据的处理也成为新闻生产的题中之义,数据新闻的数据对象不可避免地会发生改变。也有观点指出,数据新闻对开放数据的利用不足还缘于开放数据推动者与媒体的合作不够。“开放数据运动目前为止并未将新闻业视为关键部分。记者和开放数据推动者更正式的合作将是一件很有力量的事情。开放数据仍在主流新闻之外。”

理解和界定数据新闻的边界关键在于理解“数据”的含义及其诞生的背景。构成数据新闻的不是形式 ,而在于其中蕴含的政治气质及其目标。如果将数据新闻简单理解为数据科学上的意义,最终将导致数据新闻的边界模糊、泛化。数据新闻之所以被称为一项创新的实践,不只在于它用数据可视化的形式解决了以往新闻报道无法处理抽象数据的问题,更在于它是开放的数据和公众的桥梁,人们可以从数据中发现事实,用数据创造价值,用数据可视化实现新闻监督政府、促进对话的“功能性意义” (functional significance)。 pQteKEswfi5gaQQIpvecwEgONj5fy3/KT5M/mY51jU+MkP7aenawwCQV83Lhpqec

点击中间区域
呼出菜单
上一章
目录
下一章
×