21 世纪以来,数据新闻经历了从诞生到快速发展的十几年。在这期间,数据新闻在英美等国家得到了主流媒体的重视并不断发展,成为业界的一道独特景观。作为一种新的报道形式,除了数据新闻本身清晰明了、信息丰富等特点使之迅速风靡全球,外部环境的推动也不可忽略。
数据新闻依赖数据而生,没有数据就没有数据新闻,没有足够的数据也就不可能有广泛、深入的数据新闻实践。数据新闻得以兴起和发展,离不开这场势不可当的数据运动——开放数据运动。《开放数据手册》中对开放数据的定义是:“开放数据是一类可以被任何人免费使用、再利用、再分发的数据——在其限制上,顶多是要求署名和使用类似的协议再分发。”开放数据强调了开放的对象是任何人,即开放数据授权任何人在公开渠道均可免费获取并使用。数据不受版权或知识产权严格限制,可以自由下载,数据以易用且可机读格式存储,如csv、xlsx等格式。
20 世纪 80 年代,在美国兴起的开放计算机源代码运动中,软件开发者自愿放弃一部分权利,允许公众在一定范围内自由使用源代码。计算机源代码的开放许可极大地促进了软件技术的交流与创新,越来越多的人认识到数据开放的价值。数据不再被认为只是一种统计学意义上的存在,而日益成为一种能提升国家竞争力的基础性战略资源。数据资源以史无前例的深度和广度被大规模地搜集、储存、处理和再加工,大大激发了公众对个人数据安全和风险的关注,促使个人对数据所有权意识的觉醒,并纷纷加入开放数据运动中。而政府作为最大的数据资源拥有者,其对数据的垄断性控制遭到越来越多的质疑。随着运动的深入,“开放政府”“开放政治”的口号逐渐衍生,要求重新界定个人与政府之间数据所有权的呼声也越来越高。最终在政府和社会力量的共同推动下,美国兴起了开放数据运动。
2007 年 12 月,美国在加州塞瓦斯托波尔举行的“开放政府工作小组会议”上提出了八项公开政府数据的准则,具体包括:①完全性(complete),所有公共数据都可用,公共数据不受隐私权、安全考量或特权限制;②基础性(primary),数据不是以修改的格式,而是以最高水平的粒度格式从源头上进行搜集;③及时性(timely),为了保证数据的价值,要能尽快地获取数据;④可访问性(accessible),为最广泛的用户提供数据以应用于最广泛的用途;⑤机器可处理性(machine processable),数据结构合理,允许通过设备进行自动化处理;⑥非歧视性(non-discriminatory),任何人都可使用数据,而不必再专门注册;⑦非专有性(non-proprietary),数据以一种没有实体独占控制的格式提供;⑧非许可性(license-free),数据不受版权、专利、商标或商业秘密规则的限制,当然,合理的隐私、安全和特权限制也是必要的。由于美国在开放数据运动中的领导地位以及这些原则的广泛性和针对性,上述八项主张实质上转化为推动全球开放数据运动的主要理念和规则。
2009 年 1 月,时任美国总统奥巴马签署了“开放透明政府备忘录”,随后美国数据门户网站www. data. gov. com上线。目前,www.data.gov.com 是美国政府数据集的唯一门户网站,各个政府部门均会在该网站上以电子表格的形式发布各类数据,真正做到政府数据开放。截至 2021 年 5 月,美国政府已开放了约 21 万个数据集,涵盖农业、商业、气候、消费、生态、教育、能源、金融、卫生、制造业、海洋、公共安全、科研、地方政府等领域。
在此之后,开放数据运动开始在世界各地得到快速发展,澳大利亚、新西兰、英国等多个发达国家纷纷开放数据。2009 年12 月,英国政府发布《第一前线:更聪明的政府》报告,将开放政府数据和提高政府透明度作为国家的首要战略。2010 年,时任英国首相的戴维·卡梅伦率先提出“数据权”的概念,承诺要为英国民众普及数据权。卡梅伦认为:“新的‘数据权’将确保人民有权向政府索取各种数据用于社会创新或商业创新。通过这些措施,我们可以创建一个最开放、最负责和最透明的政府。”
发展中国家也逐渐意识到开放数据的重要性,很多国家都将开放数据列为一项重要的国家战略。2011 年 9 月,巴西、印度尼西亚、墨西哥、挪威、菲律宾、南非、英国和美国签署了《开放数据声明》,成立了开放政府合作伙伴组织,全球已有几十个国家加入开放政府合作伙伴组织。除了国家层面,州政府与市政府也开始加入到这场运动中来,如美国纽约、旧金山,加拿大多伦多、温哥华,英国伦敦等城市。
在我国,2015 年 8 月 31 日,国务院发布的《促进大数据发展行动纲要》(以下简称《纲要》)首次在国家层面提出了“公共数据资源开放”的概念,将政府数据开放列为中国大数据发展的十大关键工程,标志着我国开始开放政府数据。《纲要》明确指出,“2018 年底前建成国家政府数据统一开放平台,率先在信用、交通、医疗、卫生、就业、社保、地理、文化、教育、科技、资源、农业、环境、安监、金融、质量、统计、气象、海洋、企业登记监管等重要领域实现公共数据资源合理适度向社会开放”。
这场数据运动能够得以席卷全球,除了政府力量的推动,还离不开社会力量的支持。汉斯·罗斯林(Hans Rosling)创办Gapminder项目,运用世界银行公开数据(world bank open data)来动态展示各个国家历年的各项发展指数,如人均寿命、二氧化碳排放量、儿童死亡率、经济增长率等。在获得第 79 届奥斯卡金像奖最佳纪录片奖的《难以忽视的真相》中,阿尔·戈尔(Al Gore)利用各类图表数据生动地向人们展示了气候变化。这些运用数据所做出的开创性举措,给人们留下了深刻的印象,也让人们深刻认识到数据所拥有的魅力。在这场运动中,媒体界所发出的声音同样高亢。英国《卫报》创办的“释放我们的数据”项目,长期致力于呼吁政府发布所掌握的数据,在这样的压力下,有不少政府部门开始发布部分数据,比如英国的官方地图绘制部门——地形测量局。还有很多记者不仅通过自己的方式搜集数据,也开始利用官方途径,比如美国记者利用《信息自由法案》向政府部门请求提供相关数据。
开放数据运动逐步推进,不仅为数据新闻提供了潜在的数据资源,也成为推动数据新闻诞生的重要力量。被大量发布的数据集,虽然成为新闻记者们取之不尽的新闻资源,但同样也给新闻记者们带来了挑战。在很大程度上,政府所做的仅仅是为现有的数据建立门户网站,发布相比以往更好操作与读取的csv、xlsx格式的数据文件,这就要求记者自己去挖掘数据背后的新闻价值。
开放数据运动所带来的成果之一——开源软件的涌现,为新闻记者更好地生产数据新闻提供了极大的帮助。在新闻领域,开源软件为记者提供了低成本、高效率和极具创新性的新闻生产工具。数据新闻专家大卫·麦坎德利斯(David McCandless)认为,数据之所以越来越重要,不在于数据量越来越大,而在于记者有工具、有能力去分析这些数据。西蒙·罗杰斯认为:“免费工具(开源软件)的出现打破了数据分析、数据可视化和数据展示的技术壁垒,使之不再是少数人的专利。”开放数据运动不仅使媒体获得了数据这种“原材料”,还收获了处理数据的工具,使数据新闻得以大量涌现。
开放数据运动使新闻来源获得了开放性,人们不用再完全依赖传统新闻,比如人们可以通过独立网站“Where Does My Money Go?”(我的钱去哪了?)搜集英国政府所开放的数据,以一种通俗易懂的方式去解释英国政府是如何花钱的。这也赋予了新闻记者新的任务,因为数据开放了,并不意味着公众可以正确、深入地理解与公共利益相关的数据,也不意味着公众会主动查询、搜集这些数据,在数据开放与公众之间还存在一条难以逾越的“数据鸿沟”。对媒体而言,与公共利益相关的数据本身就是新闻生产的一部分,当大量数据开放时,如何利用这些数据资源洞察社会现实便成为一个重要的问题。这也是从事数据新闻生产的媒体们一直致力于解决的问题。在解决问题的过程中,数据新闻记者成为连接数据与公众的桥梁。数据新闻记者一端连接着掌握数据资源的机构,另一端连接着渴求数据的公众,前者只是发布数据而不会解释数据,而后者较少直接接触到这些数据。充当“桥梁”的数据新闻记者,则在二者中间进行调节与平衡,促进信息的流动。
开放数据运动已成为全球不可阻挡的潮流和趋势,目前数以百计的国家和地方政府相继建立了开放式的政府数据平台。对于新闻业界而言,开放数据一方面缩短了数据获取时间,另一方面数据公开中蕴含的公正、公平元素也让公众对数据新闻寄予厚望,增强了新闻的可信度。作为一种新报道形式,数据新闻正用它令人惊艳与新奇的特点让新闻世界发生改变。