【导读】 古人云:“孤证不立”“兼听则明”,指的就是,人们在分析问题时常常需要从多个角度来收集信息,力求最大程度地接近真相,以便做出最有力的洞察以及最优的决策。
数据信息爆炸的今天,每天都有多样、海量的数据自动生成。人们对信息的多维度需求,也越来越成为决策的常态。因此, 多源数据 (multi-source data)的概念越来越常被提及与认识。多源,指的是数据来源的多样化,如各类传统统计报表、互联网社交平台数据、物联网各类无线传感器收集到的数据、各移动设备自动采集的数据等。
数据信息时代,万物互联,世界的普遍联系性可以通过各类大大小小的数据表征被感知,人们对于世界的认知,也越来越依赖于多源数据融合后分析得出的智能决策。
下面通过小美妈妈购物的例子,来认识一下多源数据。
小美妈妈的面霜用完了,便决定去商场买一瓶。到了柜台,发现里面摆着各种各样的面霜,有好几十种,看得人眼睛都花了。根据外观和产品介绍,貌似A款面霜不错。但是不是真的就买A款呢?小美妈妈继续做了如下操作。
■拿出手机,在315消费者网站上查询这款产品有没有因为质量问题被投诉举报的情况。
■在购物网站上,查了查这款产品的价格,对比一下商店的标价是否可以接受。
■看了看面霜的成分表,逐一在互联网上查阅是否包含有害成分。
■在某商品评价类网站上,查阅这款产品的好评率。
■在某款消费者社交APP上,看了看人们对这款产品使用效果的描述,是否方便易用。
■打电话给闺蜜,问了问她是否用过这款产品,感觉如何,是否推荐。
■拿起旁边的试用装,擦在手上,闻闻香味,看看肤色效果。
■问问旁边的售货员,这款产品是不是有优惠。
上述一系列操作,就是从各种不同的渠道收集不同维度的多源数据的行动。小美妈妈购物的决策过程,就是一个汇集多源数据进行分析的决策过程。
当今时代,谁能更好掌握数据挖掘、数据分析的方法,谁就能更好地享用多源数据融合后的巨大价值,感受数据智能带来的时代红利。
多源异构数据: 多源指多个数据持有方,异构指数据的类型、特征等不一致。例如,交通管理局、各类交通APP等均持有与交通相关的部分数据,此为多源;交通管理局持有关于个体的驾龄、违章次数等关系型数据,交通APP持有关于个体地理位置信息的时序数据,它们所持有的数据类型不同,或者说持有的个体特征不同,此为异构。