大数据以其越来越迫切的实际需求和巨大的应用前景,正成为继云计算、物联网之后信息技术领域的又一热点。大数据之所以在当前受到前所未有的重视,归纳起来有以下3个方面的原因。
第一,大数据带来的问题已成为一种普遍现象。全球的数据总量正呈几何级数增长,过去3年间产生的数据量超过以往总和。2011年,全球被创建和被复制的数据总量达1.8ZB,预计2020年将增至35.2ZB。同时,企业级用户的数据拥有量增长迅速,比如,搜索引擎企业百度拥有的数据总量已达到100PB,每天要处理30PB的数据量,电子商务网站淘宝每天的活跃数据量已经超过50TB。随着移动互联网、物联网等的迅速发展,新的数据源将不断出现,GPS、传感器等数据会持续、大量产生。而数据的产生成本、获取成本、存储成本和处理成本的下降,也造成了数据体量的膨胀。
第二,发展大数据已成为经济增长的重要途径。麦肯锡全球研究院于2011年发布的《大数据:创新、竞争和生产力的下一个前沿领域》研究报告提出“大数据时代已经到来”,并指出,数据正成为同物质资产和人力资本相提并论的重要生产要素,大数据的使用将成为未来提高竞争力、生产力、创新能力以及创造消费者盈余的关键要素,成为领军企业与其他企业之间最显著的差别。与之相呼应,各类企业也越来越重视对规模化数据的分析和使用。电信、金融等行业已经达到“数据就是业务本身”的发展阶段,社交媒体、电子商务、云计算、物联网等新应用的兴起,要求企业不能再只对价值链单个环节的数据进行分析。在这种情况下,企业用户迫切需要借助大数据战略,更为全面地了解运营情况及运营环境,从而获得更多经济价值。
第三,发展大数据已成为国家发展的重要战略。2012年3月,美国奥巴马政府宣布“大数据的研究和发展计划”,涉及6个联邦政府部门,承诺投资超过2亿美元。如此兴师动众,是因为美国政府认为大数据事关美国国家安全、科学和研究的步伐。美国对大数据的重视引发了世界各国的广泛关注,各国均认同,未来国家层面的竞争力将部分体现为一国拥有数据的规模、活性以及解释、运用的能力,数字主权将成为继边防、海防、空防之后另一个大国博弈的空间。美国奥巴马政府宣布投资大数据领域,是大数据从商业行为上升到国家战略的分水岭,表明大数据正式提升到战略层面,大数据在经济社会各个层面、各个领域都开始受到重视。不仅在美国,在中国每个人每天也都在创造数据,而大量的数据可以作为国家经济预报台,预测未来世界经济将会发生什么变化,中国经济将会发生什么变化,从而为政策的制定提供数据支持。
回顾历史,历次工业革命达到的高度和影响,取决于能源、材料和先进的工艺技术。对于大数据时代的变革而言,能源就是数据处理技术,材料就是数据,新工艺就是云计算。可以设想,在大数据时代,计算资源将像电力那样成为自由流动并被使用的能源,这在互联网行业中已经成为现实,而要进入传统行业依然需要有进一步的改变。
传统行业与互联网行业相比,除了拥有同样多的数据量之外,还要面对更多的数据类型、更复杂的数据来源、更高的数据整合难度、更专业和宽泛的数据应用方向、更严格的安全和隐私保护要求。这些数据的来源包括业务交易、自动传感器、终端设备、科学仪器、生产自动化、关联或直属管理机构数据交换、管理行为等。除了那些固定的海量生产和管理数据外,各种交易行为和新应用模式还可能加快数据的积累速度。比如,银行网络应用对数据要求的爆炸性增长就源于新的网上交易和商业行为。对于传统行业而言,数据永远都在增长之中,但是存储和处理海量数据的能力是远远不够的,因此难以保证我们能够成功地从数据中搜寻出商业价值和社会价值。
传统行业的信息化建设思路和技术的落后,导致了大量数据被分离、闲置在各类彼此隔离的系统之中,同时大型行业企业、政府等也面临实时数据处理、应用方面的巨大挑战,依托传统IT已无法取得质的突破,因此如何以新的DT(Data Technology)整合数据、存储数据、处理数据、应用数据,解决业务系统实时性、并发性问题、海量数据存储计算问题、数据价值挖掘及应用问题是传统行业迫切的需求。
与互联网企业天生的大数据基因相比,传统行业容易忽略大数据的重要性。比如国内某家大型家电制造商,通过在生产线上安装传感器,记录大量一线的生产信息,利用这些分析、处理后的记录来提高产品的优品率。而这些还只能代表大数据应用的一个起点,大数据的精髓在于把自己记录的数据对外分享产生更大的价值,以及用外部的数据来解决自身的业务问题。以国家电网为例,智能电表及电能量采集系统收集数据的目的当然首先是为收费,但实际上该数据能够发挥更大的作用。首先,能够判断房屋是否闲置,这对一个城市来说可以指导房价、地价的调控。其次,电网的监控可以用来判断整个区域的工业、制造业、商业在不同的区域发展情况。电网公司面临的数据问题如图2-1所示。
图2-1 电网公司面临的数据问题
众多行业成功地应用了大数据技术。例如,互联网行业借助大数据为用户提供了更加优质的服务,获得了丰厚的利润回报;金融业使用数据挖掘、数据流处理等技术成功探索金融欺诈模式,实现了金融欺诈的实时预警;零售业利用大数据技术实现了零售市场细分和实时精准营销,大大提高了销售额。可以预见,在政府、电力、金融、石油、民航、交通、社保、公安、医疗等数据高度集中的行业中,大数据必将成为各机构提高核心竞争力、抢占市场先机的关键,必将成为企业从“业务驱动”向“数据驱动”转变的重要推力,必将为企业带来自主技术研究与产品研发的新契机,其中包括大量的设备更换和平台再建机会,市场前景非常光明。
在大数据时代的市场中,有3类公司必将受益于该技术的发展。第一,掌握大数据技术,利用互联网模式优化传统行业业务模式的信息服务方、软件服务商;第二,利用客户群优势,具备垂直整合产业链潜质和能力的公司;第三,善用数据资产或具备数据管理、分析能力的公司。这3类公司顺应大数据时代的发展趋势,必将具备广阔的发展空间和长期的投资价值。为了实现大数据市场的布局和突破,大数据公司有以下市场选择方向。
一是选择与拥有丰富数据资源和技术优势的互联网信息服务企业合作或自建互联网平台,开展大数据挖掘、分析、应用,并以此为基础面向公众提供各种类型的信息服务。支持互联网信息服务企业与专门的数据服务机构、企业合作,开展对互联网上的公开源数据的初步分析整理,开放数据整理与数据初步挖掘成果,促进各领域大数据的应用。
二是结合智慧城市建设,以政府和医疗卫生、文化教育、交通运输、公共安全等社会服务机构为切入点,加速各部门、各领域信息资源的融合共享,并接入微博、微信、社交网络等公开信息,为智慧城市各个领域提供强大决策支持,强化社会管理与服务的科学性和前瞻性。例如,通过对城市地理信息和经济、社会、文化、人口等人文社会信息的挖掘,为城市规划提供帮助;通过对城市道路、车辆信息和实时道路交通信息的挖掘,为交通管理、缓解交通拥堵提供建议;通过对自然灾害历史信息和实时天气信息的挖掘,提高对自然灾害的安全防范能力和应急处理能力。
三是选择能源、金融、电信、交通、商业零售、工业制造、现代农业等领域的重点企业或机构,鼓励其对企业积累的数据进行挖掘,为企业战略制定提供帮助,提高经营决策水平和业务效率,提升创新能力和服务质量,降低运营成本。例如,零售企业可通过对数据的实时分析,掌握市场动态并迅速采取应对措施,通过精准营销增加营业收入;工业制造企业可通过整合来自研发、工程和制造部门的数据,实行并行工程,缩短产品上市时间并提高质量。各类企业还可从产品开发、生产和销售的历史大数据中找到创新的源泉,从客户和消费者的大数据中寻找新的合作伙伴,以及从售后反馈的大数据中发现额外的增值服务,从而改善现有产品和服务,创新业务模式。