大数据(Big Data)是2009年互联网技术行业的专业流行语,最早提出大数据时代到来的全球知名咨询公司麦肯锡报告称:“数据,已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。人们对于海量数据的挖掘和运用,预示着新一波生产率增长和消费者盈余浪潮的到来。”2012年,大数据迅速成为社会热点,成为各类媒体尤其是社会化媒体上的“宠儿”,甚至有研究者将2013年定为“大数据元年”。大数据带来的信息风暴正在和已经改变了人们的生活、工作和思维方式,未来会成为人们获得新认知、创造新价值的源泉,还可能改变人与人、人与社会组织之间的关系,其影响已经深入到社会方方面面的研究中,成为形塑全新社会形态的重要技术动因。
大数据首先是一种技术手段,它将数据事无巨细地记录下来,通过一定的方式呈现出来,使得我们观察世界的手段更加多元。如果说以前我们认识世界的手段是素描、版画,有了大数据手段以后则是全息、写实式的动态影像。
早在20世纪20年代,美国著名政论家和舆论学者李普曼在其所著的《公众舆论》一书中就论及了拟态环境问题并首次使用pseudo-environment一词。他认为拟态环境有如下特点:一方面,拟态环境不是现实环境“镜子式”的摹写,而是或多或少与现实世界存在着相当程度的偏离和模糊。另一方面,拟态环境并非与现实环境完全割裂,而是以现实环境为原始蓝本。李普曼认为,在大众传播极发达的现代社会,人们的行为与三种意义上的“现实”发生着密切联系:一是实际存在着的不以人的意志为转移的“客观现实”。二是传播媒介经过有选择地加工后提示的“象征性现实”(即拟态环境)。三是存在于人们意识中的“关于外部世界的图像”,即“主观现实”。主观现实在人们对客观现实的认识基础上形成,而这种认识很大程度上需要经过媒体搭建的“象征性现实”的中介,经过这种中介后形成的“主观现实”,已经不可能对客观现实构成“镜子式”的反映,而是产生了一定的偏移,成为了一种“拟态现实”。
大数据这种“有闻必录”的数据呈现方式可以为我们提供全新的观察世界的手段,从而使得观察到的世界更加丰满、扎实和多元。
李普曼在他的拟态环境概念中,主要是将媒体所呈现出来的虚拟环境与现实环境区分开来,认为这两个环境在结构、形式、存在方式等上面存在着显著差异,而媒介作为一个人类认识的构建者在其中扮演着主观现实和客观现实的中介角色。这种划分存在着一个假设前提,那就是媒介在认识和呈现真实环境上是存在缺陷的,是无法完全客观呈现的,即媒介技术造成的是“有限的新闻窗”。随着大数据时代的到来,媒介技术给人们对于世界的认识所造成的无力感会得到极大的突破和改善,对客观环境的有闻必录,对微小数据的逐条记录,会使客观环境与拟态环境之间的距离越来越近,分野越来越模糊,拟态环境的概念也极有可能被消弭,媒介所塑造的“拟态环境”的局限性将在很大程度上消失,人们对整个世界的看法将逐步逼近社会真实,整个社会的思维方式和认知方式也会相应地变化。
大数据的兴起带来了一系列技术,其中包括数据可视化技术。可视化旨在借助于图形化手段,清晰有效地传达与沟通信息。数据可视化与信息图形、信息可视化、科学可视化以及统计图形密切相关。当前,在研究、教学和开发领域,数据可视化乃是一个极为活跃而又关键的方面。“数据可视化”这条术语实现了成熟的科学可视化领域与较年轻的信息可视化领域的统一。大数据一定程度上促进了可视化技术的飞跃式发展,尤其是大数据将地理位置数据、情感信息数据等整合起来,原来二维的数据可视化技术得到了质的发展,数据呈现更加立体多维,对外在世界的建构手段也日益多元化。
在新闻生产中一直存在着一种新的新闻产品,即数据新闻。数据新闻是将数据展现与新闻报道相结合,让普通受众能轻而易举地感知到数据背后的新闻价值。这种新闻产品在大数据时代得到了更好的发展土壤,数据的呈现日益直观化甚至互动化,社会真实得以在数据世界中以具象和充盈着质感的方式重新再现。这种再现虽然是数据的二次结构化,但这种建构世界真实的方式无疑会影响人类的认知方式和思维方式,进而引起思维上的革命。
预测分析(Big Data Predictive Analytics)可以称得上大数据的“圣杯”,也是众多数据分析人士的终极梦想。正如被誉为“大数据时代预言家”的牛津大学网络学院互联网研究所治理与管理专业教授维克托·迈尔-舍恩伯格认为的,“大数据的核心就是预测,不是要教机器像人一样思考,而是要把数学计算运用到海量数据上,来预测事情发生的可能性”。预测,作为大数据的力量核心,早已被多次证明。谷歌公司通过对搜索关键词进行分析,比政府检测部门提早两周预测到禽流感分布与流行的区域,提供了准确的预警服务;美剧《超感警探》中的心理专家只能依靠神奇的特异功能破获毫无头绪的案件,而现实中,洛杉矶警察已经可以通过犯罪预测软件的使用,计算出某地发生犯罪的概率、犯罪类型,以及最有可能犯罪的时间段,使洛杉矶山麓地区的盗窃案减少了25%。
“大数据开启了一个重大的时代转型。就像望远镜让我们感受宇宙,显微镜让我们能够观测到微生物一样,大数据正在改变我们的生活以及理解世界的方式,成为新发明和新服务的源泉,而更多的改变正蓄势待发”。维克托·迈尔-舍恩伯格预言,大数据的商业价值开发和利用,将成为行业人士争相追捧的焦点。
随着社交媒体时代的来临,新闻生产已经从原来的专业化组织生产过渡到更广阔的社会化大生产阶段。传统新闻生产主要的任务是建构社会真实和诠释世界现实,所做的更多工作像“麻衣相”——只知故去,不知未来。今天的新闻是明天的历史,但对社会现实的预测性却无从谈起。随着大数据的兴起,新闻预测已经越来越具备可能性。目前已经有相关的机构开始了尝试,如国内某知名证券公司,将国内外所有的新闻财经媒体报道都搜集过来,并结合网民对股市的基本情绪量表,测算出次日的股市涨落变化,为投资者提供参考建议。这种方法已经具备新闻预测的基本雏形。随着大数据技术的不断完善,尤其是各种数学模型和真实案例的出现,预测未来会变得越来越具有现实性,而不再是可望而不可即的梦想。
因为相对于受众来说,媒体目前提供简单的资讯信息已经无法满足他们的需求,媒体需要提供更多的服务来满足受众,其中非常关键的需求之一就是预测服务。以往包括央视以及地方卫视在内,其观众习惯的风格是,获取他们提供的资讯内容,而这些内容是正在发生或者已经发生过的。以清明节为例,媒体能为观众带来的只是过去式的“×××景点人多拥挤”。而这些对于已经到达该景点的游客来说,并没有多大的价值。2014年4月百度与央视联合发布五一长假出行的旅游景点舒适度预测,告诉全国各地的游客,天南地北哪些景区人多拥挤,哪些景区人少舒适。不仅如此,央视还告诉游客,如果所要到的目的地是人多拥挤的地方,应该怎么利用百度预测进行应对调整,等等。不难看出,央视在百度大数据的支持下所扮演的不再仅仅是一个“资讯提供者”的角色,而是一个“服务提供商”的角色,可以为每一位观众提供基于大数据的出行决策,甚至是一站式的解决方案。由此,无论是节目的收视率,还是用户的黏性,都会得到直接提升。