购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

英国《卫报》的数据新闻实践

章戈浩

本文以英国《卫报》的各类数据可视化为例,分析了数据新闻在新闻实践中运用以及对传统媒体带来的挑战与机遇。数据新闻并不等同于在新闻实务中直接引入数据分析技术或可视化技术,其核心仍是新闻叙事,而在《卫报》的新闻战略中,数据新闻实质上是其应对新媒体特别是公民新闻的冲击,而提出的开放新闻观的具体策略之一。

用数据讲故事

数据新闻(data journalism),又称数据驱动新闻(data driven journalism)。它指的是对数据进行分析与过滤,从而创作出新闻报道的方式。近年来国际知名媒体《纽约时报》、《卫报》、《经济学人》和英国广播公司等纷纷推出了自己的数据新闻作品。2010年7月,在维基解密事件之中,数据新闻更是大显神通,数据新闻这一概念开始大行其道,在研讨会和学术论文中被屡屡提及。较早从事数据新闻实践的新闻从业者更是频频在媒体网站与个人博客对这一新的新闻形式大力推介。芬兰学者发布了《数据新闻趋势》的研究报告,世界各地最早尝试数据新闻的业界与学界人士还共同推出了集当今数据新闻实践大全的《数据新闻手册》。

当然,在传统的新闻操作中也曾有过基于数据分析与综合而完成的新闻作品,事实上,采用统计或量化方法分析数据并生产新闻的方式与理念在新闻学界早已有之,如菲利浦·梅耶的《精确新闻》与《新精确新闻》就是这一领域的先行者。上世纪90年代以来西方新闻学界又提出计算机辅助新闻(Computer Aided Journalism/Reporting)的概念,以及新闻2.0、数据库新闻等一系列概念。它们从不同侧重点表达了当前时代传统新闻面临新媒体挑战而作出的转型努力。可以说,数据新闻正是承袭了在新闻实践中引入社会科学研究方法的努力之一。

不过,近年兴起的数据新闻至少在三个方面有所突破。

首先,数据新闻所分析的数据量级已远非传统新闻操作中数据图表可相提并论,其数据多以上万甚至百万、千万计。这当然是拜信息技术发展所赐,为数据分析与数据挖掘技术的大力发展提供了可能。

其次,在作品展示方面,由于可视化技术的发展,以及网络媒体的出现,使得互动式可视化效果在新闻作品中的呈现成为可能。虽然数据新闻作品也有在传统媒体中展示的,但总体来说,主要仍出现在各类数字媒体平台之上。

最后,更重要的是,以往更多的是文字为主、数据为辅(data for the journalism)或是数据与文字相辅相成(data with the journalism),而数据新闻则是数据为先、文字在后,数据驱动的新闻,在一定程度上改变了新闻生产的思路与流程。不同于传统新闻,主体由对事实的描述或当事人的话语引用构成,数据新闻更多的是对数据的展示。因而数据可视化(data visualization,也有人称之为信息可视化information visualization)成为数据新闻的重要组成部分之一。

然而,并不能简单地认为数据新闻就是与数字打交道,或画出夺人眼球的信息图。它与传统新闻一样仍然是在讲述故事,讲述数字背后人的故事,只是采用了数据新闻的方式,可以更简单而清晰地让受众明了复杂的情境。从某种意义上说,数据新闻实际上整合了从传统的调查新闻到统计、从设计到编程的若干个专业领域。它对新闻从业人员提出了更高的要求,而对新闻的受众来说,新闻的价值则大幅提升了。

Lorenz将数据新闻的生产过程以下图所展现的方式加以描绘:数据经过过滤与视觉化后形成故事,而在这一过程之中,于公众而言数据的价值也提升了。

Bradshaw则依照传统新闻学里关于“倒金字塔”结构理论,提出了数据新闻的双金字塔结构(见下图)。倒金字塔的自上而下是编辑、清理、情境与综合,而通过传播的连接,是一个正金字塔,自上而下是视觉化、叙事、社交化、人性化、个性化、应用化。与Lorenz对于数据新闻生产与制作流程的观念一致,Bradshaw也认为数据新闻的产生基于对原始数据的分析并将其放入具体的情境,不过他同时还强调,数据新闻通过可视化形成新闻叙事之后在各种平台发布而实现社交化,然后,读者可以进一步将新闻作品按个人的兴趣与需求加以应用。

不过最先从事数据新闻报道的一批编辑记者也意识到,不能仅仅将数据新闻视为数字技术,也不能把数据分析与数据挖掘技术或数据可视化等同于数据新闻,英国《卫报》数据新闻编辑Simon Roger曾说:“数据新闻不是图形或可视化效果,而是用最好的方式去讲述故事。只是有时故事是用可视化效果或地图来讲述。”

《卫报》的数据可视化与数据新闻

在诸多较早投身数据新闻实践的媒体中,英国的《卫报》成绩斐然,别具一格。《卫报》在众多国际媒体中不仅较早地意识到新媒体带来的挑战,也较早地把握了新媒体所带来的机遇。2006年6月13日,《卫报》宣布了“网络优先”的报道策略,要求所有的稿件先在网络上发布,然后才在纸质版本上登出。

“网络优先”的策略强调将传统报业的优势用网络彰显,而将传统报业的劣势用网络弥补,走出了打造报纸网络版的迷思,不是简单地将报纸内容放在网络上,而是着眼于打造全球领先的新闻网站。此后《卫报》又将此策略调整为“数字优先”,以适应移动网络等多种数字平台的出现所带来的改变。

2009年《卫报》开创了“数据博客”,可谓数据新闻发展的一个里程碑。这个设于《卫报》网站上的独特栏目从2009年1月14日上线至2013年5月,共制作各类数据新闻2500多则。涵盖政治、经济、体育、战争、灾难、环境、文化、时尚、科技、健康等不同领域,采取的形式有图表、地图以及各种互动效果图,数据类型既有量化数据也有质性数据,还有两者兼顾的混合数据。现在不少钟情于数据新闻的国际媒体均采取了类似的形式,如《洛杉矶时报》的“数据桌”(data desk)等。

不同的新闻机构在生产数据新闻时可以采取不同的策略,有的要求记者具备编程能力,而有的则是外包给软件公司;有的购入专门定制的软件工具,有的则使用免费的网络工具。《卫报》的数据新闻团队目前主要由五人组成,其中Simon Rogers创立了《卫报》的数据新闻项目,编辑“数据博客”和“数据商店”等栏目;John Burn-Murdoch本人既是记者也是数据研究者,他们两人在数据新闻界相当活跃。其他成员则并非全职的数据新闻记者,同时还隶属于《卫报》的不同部门,从事其他新闻采编工作。

目前,数据新闻的分析与可视化的不少工作都可以采用开放源代码的软件工具实现,如用于互动图表的Google chart、Google map、IBM Many Eyes、Tableau、Spotfire;用于基于时间顺序的时间线类作品的Dipity、Timetoast、Xtimeline、Timeslide;用于基于地理信息的Google earth、Quanum GIS;用于网络分析的Spicynodes、VIDI、NodeXL;用于社交媒体可视化的Storify;用于文本可视化即标签云的Wordle、Tagxedo等等。

《卫报》在早期大量使用Flash作为主要的技术支持手段来实现动态效果,但2012年10月之后,几乎不再制作这类作品。这也是近年来数据新闻制作的一个趋势,主要是由于Flash技术与部分移动网络终端不能完全兼容,加之软件成本昂贵,反而各类免费软件成为制作数据新闻的主力军。

数据新闻及其可视化可以采取变化万千的不同形式,在《卫报》的实际操作中使用最多的主要是数据地图、时间线和交互图表。

1、数据地图

让《卫报》数据新闻一鸣惊人的是2010年10月23日刊登的一则伊拉克战争日志。《卫报》使用来自维基解密的数据,借用谷歌地图提供的免费软件Google Fusion制作了一幅点图(dot map),将伊拉克战争中所有的人员伤亡情况均标注于地图之上。地图可以缩放大小,数据多达39.1万条左右。在地图上一个红点便代表一次死伤事件,鼠标点击红点后弹出的窗口则有详细的说明:伤亡人数、时间,造成伤亡的具体原因。这里既没有用枯燥的数字作毫无人性的平静描述,也没有采取夸张的文字进行煽情式的叙述,但地图上密布的红点却显得格外触目惊心。新闻从业者富于人性的思索通过精准的数据和适当的技术被传达出来。

此则新闻刊登后在英国朝野也确实引起了震动,相当程度上推动了英国最终做出撤出驻伊拉克军队的决定。

《卫报》团队在制作数据地图时一般会采用Google Fusion作为主要的工作软件,将包括地理信息如经纬度在内的各类数据,整理成表单形式,在导入Fusion后,就可以使用软件自带的功能导出地图。

在2011年9月6日刊出的英国伦敦骚乱的系列报道中,Simon Roger仍使用Google Fusion软件作图,但不仅仅是以地图标示出骚乱发生的地点,而是更进一步以热力图的方式,用不同颜色色块标示出伦敦各地区的经济指标。蓝色表示富裕地区、红色表示贫穷地区。地图明确清晰地显示出了骚乱与社会经济发展不平衡的密切相关性,从地理位置上凸显出一个分裂的社会。

而在制作这则新闻之时,所使用的数据完全是来自公开的法庭审理骚乱案件资料以及政府关于社会经济状况的统计资料。这幅地图不仅标明了骚乱爆发的地点,也形象而视觉化地阐明了骚乱发生的原因。伦敦骚乱爆发后,英国舆论与政界一度将骚乱归罪于社交媒体如Facebook、Twitter传播谣言、煽动骚乱,甚至要求关闭社交媒体。

《卫报》数据新闻团队通过与学术团队一起研究社交媒体在骚乱中的作用,分析了260万条关于骚乱的Twitter信息,观察谣言如何在Twitter上传播,以及不同的用户在宣传和散布信息中的功能,以确定Twitter和其他社交媒体是否煽动了骚乱。他们对Twitter信息进行了内容分析,分类编码为:重复、驳斥、质疑、评论,还对数据进行可视化处理,从而发现Twitter在纠正谣言方面也发挥了积极作用。

之后,《卫报》与伦敦政治经济学院的学者合作推出了一本用数据解读骚乱事件的小册子《解读骚乱》,使得新闻报道具备了带有前瞻性的社会科学研究的性质。

可视化不仅仅被用作展示或是解释(explanation)数据的工具,还成为进一步探索(exploration)数据的工作。2011年《卫报》的数据编辑团体正是凭借着灵活运用谷歌表单等工具、开创了通过数据讲述新闻的新思路而荣获Knight-Batten奖的。

2、时间线

如果说数据地图在展现数据基于地理或空间的分布时大展身手,时间线则能在表现数据在时间维度的演变时大显神威。

如伦敦骚乱报道中使用的时间线,读者拖动其下方的时间滑动条,可以动态地见到骚乱发生时不同时间段的主要事件,点击事件的图标,侧面则会弹出详细的事件描述。

从叙事角度来说,大部分的新闻叙事其实都是基于事件发生和发展的时间序列而讲述的。当讲述的时间跨度较长,或是事件众多繁杂之时,传统的新闻文本式叙述就有可能力不从心。如果将众多事件视作数据,就可以使用专门的软件制作成基于时间线的可交互的动态作品。采用时间线的形式,也可以使得众多新闻事件之间的时间顺序甚至因果关系更明晰地凸显出来。因此,不仅作品信息量增大,而且沉浸感增强,可以供读者持续阅读与使用,让新闻阅读变得如玩电脑游戏一般,使受众大大增强了参与感。

制作时间线,也并不是手工将事件逐一添加,而是先将事件的相关信息如发生时间、事件描述制作成表单文件,再使用专门的软件生成的。

3、交互性图表

不少传统媒体在报道涉及财政经济方面的话题时,都尝试过使用界面友好的图表来取代枯燥的数字进行阐释。数据新闻的概念被广泛采用之后,使用各类图表变得更为灵活多变。一方面,尝试使用各种富有创意的图表来说明海量的大数据,如泡泡图、树图;另一方面借助网络和其他数字平台,使用交互性强的图表形式。

如2011年10月《卫报》推出的关于政府各部门开支的报告堪称经典。数据编辑制作了一个动态的图表,点击后可以通过缩放效果看到不同部门花费之间的对比。而同时制作的一幅静态图,则以大小不同的气泡和不同的层级,简单明了地说明了政府财政开支的分配情况。

前不久,撒切尔夫人去世后,对她如何评价争议不断。“数据博客”上立即刊登出一系列交互式图表,相对于炫目的视觉化效果,这一组图表仅仅使用常见的树状图、折线图,将撒切尔夫人执政时期及其前后的一系列社会政治经济数据指标罗列出来,但由于图表是交互性的,让读者可以通过点击图表上不同的时间点,显示出特定历史时刻的各项数据,读者可以自行比较,然后做出自己的判断。

当然,数据地图、时间线与交互图表并不是数据可视化的全部,也不是数据新闻的全部,仅就可视化而言,还有不少表现形式,如层级图、社会关系网络图、标签云等。近几年十分流行静态的信息图,虽然有些研究者并不将其视为数据可视化,但也是数据新闻中重要的表现手段,它与传统平面媒体新闻实践中图文并茂表现数据的方式非常接近,不过《卫报》较少使用信息图。

4、传统媒体平台上的数据新闻

尽管数据新闻往往借助新媒体技术来制作与呈现,但这并不意味着传统平面媒体对此无所作为,有趣的是,《卫报》作为传统大报非常注重传统媒体与新技术的结合,不少精彩的基于网络或数字平台的数据新闻作品,也被“翻译”到平面媒体之上。当然,这也是新闻设计师、美术编辑最为头疼之处:如何发挥出平面媒体的优势与特点,扬长避短地让数据新闻在平面上活起来。

相对来说,数据地图在平面媒体之上较易展现。但由于已有不少经典的基于数据地图的作品珠玉在前,加上在平面媒体上网络作品的互动性丧失殆尽,因此唯有另辟蹊径,才能有所突破。

如以下这幅关于阿富汗战争的数据地图,相对于可互比的网络数据地图不遑多让,反倒是别具特色:将在网络上展现时需要用鼠标点击方能展开的文字说明环绕排列在主地图旁,四处点缀以适合情境的小图,同样显得一目了然。虽然网络数据地图可以逐级放大缩小,但由于往往调用诸如谷歌地图之类,美观性难以保证。在平面媒体上表现时则可以放手一试,换用更为清晰、美观的手绘地图,也可以使用地理信息系统自行绘制,或者购买专业性地图。在此例之中,《卫报》花费了近千英镑(合万余元人民币)用于购买专业卫星地图。

有时数据新闻会与传统的新闻版式设计加以结合,如在英国王室大婚的报道之中,《卫报》刊登的婚礼仪式的路线图虽然是数据地图,却采用了手绘地图的方式加以呈现。

由于数据新闻所涉及的数据量巨大,如借用维基解密资料制作的伊拉克战争伤亡的新闻,数据量就多达39.1万条,而关于政府的新闻则达到百万级的数量。在数据新闻的制作过程中,虽然最引人眼球的是各种让人目瞪口呆的可视化效果,但实际上主要的工作却是辛苦地收集数据、分析数据,特别是清理数据的过程,最为费时耗力。

作为开放新闻的数据新闻

《卫报》团队较少使用信息图的方式,相比数据地图、时间线、交互图表,一个重要原因在于信息图的互动性要相对弱一些。《卫报》团队对于交互性的数据新闻作品的强调,实际上与《卫报》一直倡导的“开放新闻”观念相辅相成。

伴随着新媒体对于传统媒体的挑战以及公民新闻的出现,《卫报》的应对之策是开放新闻,即并不将公民新闻视作对传统媒体的挑战,而是将其引作自己的报道内容。毕竟记者并不是世界上唯一的报道专家,所以在《卫报》眼中,开放新闻才是唯一的发展方向。

自从提出“网络优先”、“数字优先”的口号之后,网络平台或其他数字平台其实已经不仅仅是信息发布的平台或工具,而同时成为信息收集的平台和工具。新闻先在网络平台或是其他数字平台上发表,有时即时就会出现读者的评论,编辑部门可以根据读者的反馈来调整稍后推出的印刷版本中不同新闻的版面位置与报道篇幅,同时也可以通过采集读者的评论作为进一步跟进报道的依据。

在《卫报》的网站上有专门的“开放新闻”栏目,供读者主动提供自己制作的新闻作品。在另一个特色栏目“新闻博客”中,对于突发事件的报道,就是采用滚动的方式,将读者在社交媒体上对事件的文字报道、图片、视频,甚至通过电子邮件发来的评论,全部整合到一处,成为报纸网络上不断更新的报道的一部分。而后,再据此进一步加工成印刷版的定稿内容。

数据新闻为实践“开放新闻”的理念提供了另一种可能。在《卫报》数据新闻团队的眼中,数据新闻与公开新闻是“一张饼图上的两部分”,数据新闻基于可以公开获取的数据从事新闻制作。现在不少国家和政府虽有信息和数据公开的制度,但这并不意味着公众可以充分地理解与运用与他们日常生活相关的数据。恰恰相反,不少数据对于公众来说是无法理解、毫无意义的,有些时候甚至是完全误导的。此外,有时宏观的数据对于公众而言往往也不具有实际意义。

数据新闻的作用就在于从数据中发现故事,将某些数据与其他数据相结合,并寻找出对公众有意义和有价值的新闻。但专业记者对于数据的解读也并不是唯一的和全面的。随着数据分析和可视化技术门槛的降低,公众有时也可以根据自己对于数据的理解,做出自己的分析。因此,《卫报》数据新闻的一个鲜明特色在于,它将制作新闻所使用的数据完全公开,在“数据博客”页面上,所有数据新闻所使用的原始数据均可以免费下载,供公众用来作进一步分析。这也正是Bradshaw所看重的数据新闻金字塔结构中,那个不同于传统新闻实务中倒金字塔的正金字塔。

数据新闻正是由于其互动性,而可以被不同的用户加以个人化,再通过将个人化后的数据新闻再度社会化,进一步扩大了新闻产品的传播和应用范围。

此外,有些充满互动性的数据新闻作品本身又成为生产数据的基地和收集数据的平台。换言之,数据新闻在开放新闻的原则之下,不仅仅提供了信息,也提供了个人化的议题。比如在对伦敦骚乱的报道中,《卫报》就鼓励读者将自己拍摄的骚乱发生前后的照片上传到社交媒体,而此后的若干数据可视化新闻正是基于读者生产出来的这类数据。

曾任《卫报》主编的英国著名报人、政治家C.P.Scott曾经在1921年写下过一名名言:“评论是自由的,但事实是神圣的。”这句话一直被《卫报》奉为圭臬。有趣的是,数据新闻记者Simon Rogers特意将新近出版的一本关于《卫报》数据新闻专著冠以《事实是神圣的》的书名。在Scott执掌《卫报》的时代,正是报纸媒体如日中天之时,他或许并没有想到,在传统平面媒体面对新媒体的众多挑战而陷入四面楚歌的境地之时,借助新兴的媒体技术与新闻实践的创新,数据新闻让自己的名言再度复活。

作者系澳门科技大学人文艺术学院助理教授
本文发表于2013年06月05日《新闻记者》 qW5C0ZFpRaKBJ6xEtie0DSBctmoJF6uwN1sHi/RP43ruOCpS1XeElTHZtstpT0z3

点击中间区域
呼出菜单
上一章
目录
下一章
×