尼古拉斯·尼葛洛庞帝 说过,渐进思想是创新最大的敌人,面对全新的大数据时代,如果还是拿过去的思想去理解和思考,可能会阻碍科技对社会的推动作用。更进一步说,任何一个新时代的到来,都将迎来思想方式的大变革。为了更好地融入未来的社会和更好地理解5G大数据,我们一起来看看科技带来的思维方式变化,继而用新思维去观察和透析社会及经济的变化。
数据即世界
之前我们曾提到,数据是信息的载体,记录赋予数据意义,因此,数据从本质上来说是真实世界的一种映射。如果我们将数据进行大致的分类,就更易于理解。
首先是感知数据,这也是人类最早记录的数据。感知数据指通过眼睛、耳朵和皮肤等感觉器官接收到外部刺激,从而产生相关感知的数据。当然不能把感知数据想得太简单了,在日常生活中,人际往来都可以看作是感知数据的来源,因此感知数据便顺理成章地成为人类生活圈的映射。
其次是测量数据。人类与动物最大的区别是能够使用工具,而测量数据正是来自人类对工具的使用。测量数据更具象、更精准,也更客观。如果说感知数据偏向于人际往来,那么测量数据就偏向于自然了。如今,关于测量数据,最有发言权的莫过于传感器,可以说各式各样的传感器让人类拥有了观察更广阔天地的“眼睛”、聆听万物的“耳朵”和感知自然的“皮肤”,这相当于在机器的身上延续了人脑的功能。随着传感器的种类愈加丰富,人类的感知范围也越来越广,许多人类不能或不方便感知、测量的,可通过机械化的“五官”将其准确地数据化,因而,数据所反映的世界进一步扩大。我们可以看到,大至气候的变化、小至细胞的增长以及细菌和病毒的活动,现在都可被人类感知到。
感知数据和测量数据几乎已经能够反映世界的绝大多数运动,但还有另一个数据也同样值得关注,那便是计算数据。我们无法分辨计算数据和测量数据哪个先出现,但计算数据由于其自身的特点,无疑成为数据家族最重要的成员之一。计算数据之所以如此重要,在于它不再是外部世界简单、直接的映射,而是经过人类知识处理的映射结果。比如,气象数据反映了当前的气候情况,但计算数据则让它能够预测未来一段时间的变化。更为特别的是,由于某些数据难以量化,因此感知数据往往并不能给出准确的衡量,这为数据刻画世界带来了不便,计算数据则解决了这个问题,一个很多人忽视的事实便能说明这个问题——资产证券化 。资产证券化的发明是由于计算科技的发展让风险得以精准的量化,使得不同资产的捆绑、评级、销售成为可能。
这便是5G大数据时代思维方式的第一个改变,数据不再仅仅是信息,而是世界的直接映射。不管是人际交往数据,还是自然事物和工厂设备的参数数据,抑或是社会科学中难以量化的无形资产,在先进的传感器技术以及不断完善的社会科学研究成果的帮助下,都可以很好地为人类所用。因此,在未来,你看到的数据实际就是世界存在的物质甚至是思想,只不过是以另一种形式出现在你的面前。
预测的效果
人们运用大数据的一个重要原因是获得相关关系,从而指导相应的生产生活。因此可以说,预测是挖掘大数据的意义之所在。这也是过去人类始终保持热情的一个领域,即建立一个“似乎正确”的模型对未来进行预测,然后根据预测的结果对现实施加一定的干预,从而达到一个人类想要的结果。比如占星术,通过观测天文现象、星星的运行轨迹的变化来预测未来,如果是测吉凶,可能的干预便是提前进行保护;如果是测姻缘,可能的做法是牵线搭桥。回顾漫长的人类发展史,人类做过各种尝试,其中有些部分蕴含着一些自然知识和经验积累,但大部分都是一种自我欺骗。
步入近代之后,随着科学技术的发展,人类渐渐认识到,传统预测方法的难度极大,准确度不高,对未来进行科学有据的概率分析才是正道,这便是模糊的预测。如今,人类可以通过收集各大社交平台数以亿计的信息数据,来探寻一些根植于人类心底的行为逻辑,通过对文字、图片、视频等非结构化数据的研究,发现隐藏在其中的人类交往规律。这是一个探寻规律和知识的过程,作为副产品,能对某些相关问题的走向提供一定的参照。
除此之外,模糊还在于素材的使用上。5G大数据时代的素材是数据,大数据的低价值密度隐含于对数据的使用过程中,人们不要求精准的数据,仅需要满足一定条件的数据即可。这种说法在之前可能是难以理喻的,因为在那个数据收集整理困难的年代,根据统计学理论,由于所能使用的数据量比较少,小样本中的一点点小的偏差便会对结果产生非常大的影响,为了保证数据对所分析的问题具有价值,就必须要求数据有一定的准确率和精确性。简单来讲,大数据赋予人们“以量换质”的权利,可供搜集整理的数据量变多,不同来源、不同格式的数据相互间形成补充,加之大数据技术的发展,对错误有一定程度的容忍,毕竟大数定理证实了,数据量足够大的时候,一些错误对最终结果的影响微乎其微。人们不再需要像大数据时代之前那样,绞尽脑汁地去减少误差,而是可以把更多的精力放在研究上。
正是由于这个原因,人类可以接受的数据也越来越多。大数据价值的意义其实并不体现在数据本身,而是体现在数据的集合当中。由于数据使用量的增大,要求每个数据单位都带来同样的价值是不现实的。因此,接受模糊数据就意味着接受大数据,也意味着接受低价值数据,我们很难从巨量的数据中一眼就看出哪些是有价值的,哪些是没有价值的,因此模糊预测还隐含有平等对待数据的意思。在5G大数据时代,我们应当转换思维,接受混杂,站在高处,对事物进行总体把握。
最后,回顾模糊的意义,5G大数据时代似乎让人类走进了一个更加不确定的社会,但实际上,我们走进的仅是一个对不确定性更具包容性的社会。毕竟,大数据的预测是基于“历史会重演”这样一个基本的原理,利用当下的数据对未来进行预测,会导致预测的结果往往仅适用于短期,“板上钉钉”似的确信无疑将被概率所替代,我们应该将目光从精确性上挪开,放在趋势、方向等字眼上。
数据也有生命
维克托·迈尔-舍恩伯格教授在《删除——大数据取舍之道》一书中,讲述了这么一个情景:珍妮和他的朋友约翰相识20年,但近5年并没有太过频繁的联系,近期有一个会议,他们两个有机会小聚一下。珍妮突发奇想,想要邀请约翰去他们曾经常去的小咖啡馆,但一时忘了咖啡馆的名字,于是她开始一封封地翻阅他们的电子邮件。在翻阅中,却看到了他们曾经发生过的矛盾、说出的伤人的话语和许多不开心的事情,这让珍妮直接打消了再和约翰喝咖啡的念头,也彻底地改变了自己记忆中有关约翰的美好形象。
这是少数的对于数据遗忘的探讨,也是引发我们想多写几句的部分原因。确实,当数据成为世界的映像,当数据成为人类重要的生产和生活伙伴,对数据更感性的探讨也是自然的事情。从前,当人类记录能力有限的时候,我们时常会因为遗忘而苦恼,但当我们记录能力无限时,我们又何尝不为铭记而担忧呢?当数据成为人在数字世界的映像,数据也便具有了“生命”,选择何时删除、何时留存也成了研究数据的重要话题。
就像维克托·迈尔-舍恩伯格教授书中的故事一样,电子社交的兴起,让每时每刻的数据都得到了记录。拿微信来说,删除消息后似乎数据就不在了,但实际上,通过一些简易的数据恢复手段就可以将其复原,数据可以被复制并存储在任何地方。大脑忘却的记忆可以在任何时候被数据所唤醒。“难以遗忘”意味着数据不仅保留了人的善,也保留了人的恶。结绳、纸张甚至是石画都能够被时间带走,而唯独互联网让记忆永存,这样的现实时刻提醒着我们,数据得以永生,真的是我们想看到的景象吗?我们的态度是:只有让数据也保持着代谢,才能营造一个健康且良性的信息生态。