数据新闻(data journalism)又称数据驱动新闻(data-driven journalism),顾名思义,数据在新闻报道中是驱动因素,生产活动围绕数据展开,对数据的处理包括抓取、清洗、理解、分析以及呈现。数据新闻可以理解为从数据中发掘新闻选题,利用数据来讲述故事的新闻形式。但对于数据新闻的边界,学者们却有不同的看法。比如,数据新闻更重视数据还是更偏重新闻?数据新闻的生产过程与传统新闻有何不同?数据新闻中的数据是什么样的数据?数据新闻和数据可视化有何区别?数据新闻是否可以被视为一种崭新的新闻范式?
本小节将从以上五个问题出发,探讨数据新闻的边界,并尝试给出数据新闻的定义。
数据新闻这一概念由英国《卫报》前编辑西蒙·罗杰斯(Simon Rogers)提出。2008 年,他在《卫报》网站的博文中写道:“我们的研发团队找到了一种能处理原始数据,也能进行数据映射的应用方式。这意味着我们能生产一种奇妙的、基于数据的互动图表。”
之后,西蒙·罗杰斯在《数据新闻大趋势:释放可视化报道的力量》一书中也强调了数据、数据处理和数据可视化是构成数据新闻的三要素。斯坦福大学的杰夫·麦吉(Geoff McGhee)曾担任《纽约时报》的媒体记者,他认为如今的新闻越来越与数据相关,媒体有责任向公众解释复杂难懂的数据。可见数据新闻从诞生之初,就跟数据处理和数据可视化密不可分。
英国伯明翰城市大学的保罗·布拉德肖(Paul Bradshaw)却认为,数据新闻是将新闻敏感性与运用数据讲故事能力进行高度融合的新闻形式。从这一角度出发,数据新闻的落脚之处在于新闻本身而非数据。
保罗·布拉德肖认为数据新闻是一种新的信息采集与加工过程,并用 4C的倒金字塔结构来说明数据新闻的生产流程,即数据新闻的制作过程包括数据搜集(compile)、数据清洗(clean)、了解数据的背景(context)、数据的结合(combine)。德国之声的记者米尔科·劳伦兹(Mirko Lorenz)也有类似的观点,她将数据新闻生产分为数据、过滤、可视化和故事四个环节。随着每个环节的向前推进,数据的价值对公众而言不断提升。
尼古拉斯·凯瑟·布瑞尔(Kayser-Bril Nicolas)在庆祝数据新闻产生 10 周年的文章中提到,数据新闻是使用结构化数据所做的新闻,结构化数据是可以被计算机处理的数据。事实上,随着数据新闻实践的不断发展,如今,数据新闻中需要处理的数据不仅包括结构化数据,还包括半结构化数据和非结构化数据。
数据新闻和数据可视化似乎是一对密不可分的概念,数据可视化是数据新闻生产流程中不可或缺的一环。数据可视化,指的是利用计算机图形和图像处理技术,将数据转化为直观、易于理解的图形或图像并在屏幕中显示出来。同时,数据可视化的应用范围更广,是一门涉及计算机图形、图像处理、计算机视觉和人机交互等多个领域的综合性学科。
数据新闻是一种崭新的新闻范式,还是一种“噱头”?
正如前面探讨的内容,数据新闻的生产流程发生了转变,对数据的处理贯穿整个新闻生产的过程。同时,数据新闻更强调“产品”的概念,而非传统新闻生产中对于文字的构思或对于音视频材料的加工。我们应该看到,数据新闻萌生于传统新闻之中,但是与传统新闻又有较大不同。它诞生于大数据时代,代表着未来新闻发展的新方向之一。
综合以上分析,笔者认为从构成要素上看,数据在数据新闻中有着举足轻重的作用;从新闻制作流程上看,记者和编辑通过数据统计和分析,依靠可视化技术进行新闻呈现;从数据形式上看,数据新闻中的数据包括结构化数据、非结构化数据和半结构化数据,形式多样;从新闻呈现形式上看,数据可视化是数据新闻重要的表现形式但绝非唯一的表现形式;从新闻范式上看,数据新闻以图表、数据、互动程序为主,以文字为辅,是一种区别于传统新闻的崭新的新闻范式。
数据新闻既是业界讨论的新兴新闻形式,也是学界的研究热点。国内外学者围绕着数据新闻的边界进行了讨论,对于数据新闻的定义也有不同的意见。《数据新闻手册》( The Data Journalism Handbook )将数据新闻定义为一种运用数据处理技术生成的新闻报道形式,它赋予了新闻工作者通过信息图表等视觉化手段来呈现复杂数据的能力。西蒙·罗杰斯为数据新闻下的定义则是:数据新闻是一种通过对数据的分析、挖掘来报道新闻的形式。他认为数据新闻结合了新闻业最有效的技巧(包括数据可视化、简明解释和前沿技术)和最佳的叙事方式讲述新闻故事。它应该是开放的、易用的和具有启发性的。我国学者们对数据新闻有其他定义,章戈浩认为数据新闻指的是利用分析与过滤所获得的数据,从而进行新闻报道的方式。祝建华认为数据新闻是用来分析和过滤海量新闻数据的工具,它通过对数据进行整合,从而挖掘新闻。方洁认为数据新闻是基于数据的抓取、挖掘、统计、分析和可视化呈现的新型新闻报道方式。
综合国内外学者的观点,笔者认为数据新闻是通过数据的挖掘和处理,将庞杂无序的数据梳理为清晰易懂的信息,并以数据可视化的形式呈现的新闻形式。