购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

ICT与大数据时代:新词旧赋

上述定义虽然没有给出大数据的标准尺寸(实际上也不可能有一个统一的标准),但对于认为大数据的数据集就必须要足够大这种数据神话的盲目崇拜必须消除。Gartner公司的分析师Mark Beyer(马克·贝耶尔)说过,“神话有助于缓解焦虑,但于解决问题无益”。大数据虽是出炉不久的新术语,其关于海量数据分析与处理的内涵却并不新。

大数据是由信息技术、互联网发展而来,并逐步升级为相对独立的技术和产业体系。信息技术的核心包括信息处理、信息存储和信息传输。最近几十年信息技术的不断进步带来了信息处理、信息存储和信息传输能力的飞速提升。摩尔定律发现芯片上可容纳的晶体管数目每隔18个月左右便会增加一倍,性能也将提升一倍。在摩尔定律的指引下,信息产业周期性地推出新的计算机,操作系统和计算能力被不断提高,推动了信息技术的持续进步。1977年,世界上第一条光纤通信系统在美国芝加哥市投入使用,拉开了信息传输能力大幅跃升的序幕。随着信息基础设施的持续完善,包括网络带宽的持续增加、存储设备性价比的不断提升,2000~2015年,CPU(中央处理器)晶体管数量增加100倍、硬盘价格降低为初始价格的1/200,为大数据的存储和传播打下了良好的物质基础。

互联网的出现,将每个人的计算机连接起来,逐渐成为人们获得各类数据的主要渠道。通过互联网获取数据的模式可以抽象为不断“请求”+“响应”的过程。每一次的访问“请求”就是一次鼠标点击操作(鼠标出现之前是通过“回车键”来实现),而服务器的日志中会忠实地记录每一次的访问时间、请求命令和访问地址等数据。这些日志就好比人们在互联网上的“脚印”,“凡走过,必留下痕迹”。这些“脚印”蕴含着大量信息,因此可以说,各类服务器上的日志构成了一种大数据类型。最早重视这些数据价值的也正是触觉灵敏的互联网公司。

云计算改变了数据的存储和访问方式,为大数据的集中采集、存储和分布式访问提供了必要的场所和分享渠道,因此可以说,云计算是大数据诞生的前提和必要条件。物联网和智能终端的普及带来了持续不断的大量数据,且数据内容鲜活、数据类型丰富,是大数据的重要来源。 bsZj4HeXvffkfPKIDtqsz+CSKWsEd6SUg8O1Ctt2MOU9SVGBUe2ADFyFWVjqI6o/

点击中间区域
呼出菜单
上一章
目录
下一章
×