虽然大数据的概念在业界暂时没有统一的定义,但是大数据的基本特征还是基本有着比较统一的看法:数量庞大、类型多、处理速度快和价值密度低,简称4V特征(Volume、Variety、Velocity、Value)。4V特征的具体理解为:
在大数据时代,网络技术高度发展,承载数据资料的个人电脑、手机、平板电脑等网络工具已经普及,数据材料的来源范围在不断拓展,人类获得数据资料在不断更改数据的计量单位。它的计量单位从TB级别,跃升到ZB级别,说明了数据量增长的质的飞跃。根据IDC的“数字宇宙”的报告,预计到2020年,全球数据使用量将达到35.2ZB。
大数据时代的数据类型不仅有以文本资料为主的结构化的数据,还有网络日志、XML、HTML、音频、视频、图片等半结构以及非结构化的数据资料。
能够从各种类型的数据中快速获得具有较高价值的资源,并且在信息高速生成的同时也在不停地进行处理,形成一个能够进行及时查询的连续的数据信息流。它强调数据的动态变化很快,大数据的重要特征便是形成流式数据。
大数据中存在各方面反映人们生产活动、商业活动和心理活动等有价值的数据,但由于大数据的规模巨大,数据一直在不停地更新变化,有价值的信息可能转瞬即逝。一般来讲,价值密度的高低与数据的规模成反比。