|
2015年大数据产业发展概况 |
2015年,国务院印发了《促进大数据发展行动纲要》,提出了我国大数据发展的顶层设计,明确指出要全面推进我国大数据发展和应用,加快建设数据强国。随着国家文件出台,各地方省市进一步出台相关政策规划推动大数据发展,大数据在各行业的应用也进一步加快,市场规模增速明显。易观国际数据显示,2015年,我国大数据市场规模达到102亿元,同比增长35.2%(见图1)。
图1 2011—2016年我国大数据市场规模
数据来源:易观国际数据 2016,01。
2015年,大数据在行业领域的应用进一步深化,尤其在金融、征信、医疗等领域,大数据应用取得了初步成效。金融风险管控领域,大数据已经成为反欺诈的重要手段。同盾科技、中智诚等企业基于多样化的机器学习模型、大数据关联分析和指标计算等,以云服务的方式为各行业提供网络反欺诈保护,提供更准确、更全面的反欺诈服务,得到了资本市场的青睐,2015年,同盾科技获得3000万美元的B轮投资。征信领域,2015年,央行批准8家机构进行个人征信业务,其中就包括阿里巴巴、腾讯等大数据企业,此类企业对用户在网上交易的行为数据进行采集、整理,再经过深度挖掘和评估,形成对客户的风险定价。医疗领域,深圳市儿童医院搭建信息集成平台,整合原有分散在多系统中的海量数据,实现各部门的信息共享,同时通过商业智能分析对集成数据进行深入挖掘,为医院各部门人员的科学决策提供全面辅助,提升了医院的服务水平和管理能力。医渡云公司与我国排名前20位中的12家三甲综合医院开展战略合作,覆盖全国400余家医院,打造“医度”这一医疗大数据平台,功能包括:数据获取、大数据存储和计算、机器学习和应用,专注于医疗数据处理和深度挖掘,为医生、医院、顶级科研机构和监管部门提供基于自然语言的病历搜索、辅助诊疗、循证医学科研等大数据技术服务。
面对大数据浪潮,互联网企业率先进行了大数据探索,对如何应用大数据积累了宝贵的经验。2015年,互联网企业积极探索同政府部门合作,将这些大数据能力和经验应用于交通、旅游、经济预测等公共服务领域,助力政府服务能力提升。百度与九寨沟、四川旅游局、山东旅游局已达成合作意向,为景区及政企提供智慧旅游大数据解决方案。其中,九寨沟客流量预测能够辅助九寨沟景区进行安全管理、人流疏导,提升游客在景区的旅游体验,已经取得良好效果。国家统计局也已与腾讯等互联网企业合作,构建以结构化数据和大数据为基础来源的现代化政府统计,生产更多、更好、更有价值的统计产品,为国家宏观调控、人民生活改善、社会福祉提升提供坚实数据支撑。
掌握云计算技术的企业在发展大数据业务时体现出的竞争优势尤为明显。随着数据规模的快速增长和大数据应用的增多,在云端提供大数据服务(DaaS)已成为行业共识。谷歌、亚马逊、甲骨文、阿里巴巴、百度、Cloudera等企业都在依托自身的云计算能力推动大数据发展。不具备云服务能力的大数据初创企业,往往要通过租用云计算企业的平台资源,才能提供大数据应用服务。
开源技术的发展推动了以企业为核心的生态发展模式向以技术为核心的生态发展模式转变,各类型企业,甚至是竞争对手也都在为打造同一个生态而努力,竞争格局由零和博弈转向竞合互补。例如,谷歌、微软、脸谱等企业都在支持Hadoop、Spark、Storm等生态发展,同时也分别与众多企业合作打造大数据垂直生态。
大数据商业模式的创新还较多地出现在数据的存储、计算、分析和可视化等已相对成熟的环节,而令人期待的关系挖掘、沉淀价值利用、数据社交和跨界连接等模式尚未成熟。例如,利用数据关系挖掘,进行商业精准化服务和辅助管理决策的商业模式还缺乏实践。
2015年,金融资本热衷于投向掌握行业应用产品和服务的企业,或具有行业应用开发潜力的公司(见表1)。其中,交通、健康、金融、教育、电子商务、娱乐等领域的融资并购频繁。
表1 2015年我国大数据领域融资并购部分事件情况(一)
数据来源:赛迪智库整理 2015,12。
数据资源是大数据产业发展的基础,掌控了数据资源,才有可能提供高端的数据分析挖掘产品及服务,从而获取更高的商业价值。2015年,众多投融资事件的背后都反映了对数据资源的布局(见表2)。
表2 2015年我国大数据领域融资并购部分事件情况(二)
数据来源:赛迪智库整理 2015,12。
2015年,随着《促进大数据发展行动纲要》的发布,我国各省市对大数据的推进力度进一步加强,通过相关政策、项目、技术和应用推动大数据发展。总体来看,各省市的主要举措包括以下五个方面。
我国已有广东省、辽宁省、四川省、广州市、中山市、沈阳市、黄石市、兰州市、成都市等多个省市成立了大数据管理局等统筹协调大数据发展的机构,以便充分发挥政府领导的统筹决策作用、政府部门的引导带动作用,在整合利用各方资源的同时,突破传统观念、部门利益等限制,快速推进大数据发展与应用相关工作。
各省市积极引导建设以企业为主体,科研机构、高等院校、用户单位等参与的大数据产业联盟。联盟作为重要的中介机构和行业组织,其主要目标是加强对行业发展重大问题的调查研究,共同推进大数据相关理论研究、技术攻关、数据开放共享和创新成果应用推广,参与有关产业政策制定。产业联盟在建设大数据平台、推进大数据项目实施时能够发挥牵头推进的重要作用。我国部分地方大数据产业联盟建设情况如表3所示。
表3 我国部分地方大数据产业联盟建设情况
数据来源:赛迪智库整理 2015,12。
大数据资源平台主要用来存储各类可开放的数据资源,并提供资源管理、下载、共享等功能。在实际运作中,大数据资源平台可能表现为公共数据(资源)门户网站的形式(特别是对公众完全开放的大数据资源平台),例如,“北京市政务数据资源网”(www.bjdata.gov.cn)、“上海市政府数据服务网”(www.datashanghai.gov.cn)。
为促进企业(机构)间数据的流通、进一步发挥数据资源的增值作用,同时保护数据资源生产者、维护者的积极性,各省市纷纷试点数据交易所的建设,推动形成数据资产交易市场,以使得数据资源能够按照市场引导、价值驱动的方式在各利益相关方之间流动。我国大数据交易中心建设情况如表4所示。
表4 我国大数据交易中心建设情况
数据来源:赛迪智库整理 2015,12。
开展应用示范是各省市推动大数据发展的有力抓手。上海市重点选取了金融证券、互联网、数字生活、公共设施、制造和电力等行业,提出建设金融大数据分析与智能决策支持系统、面向互联网的大数据分析和服务系统、数字生活大数据服务系统、公共设施大数据服务系统、制造业大数据系统,开展大数据行业应用研发,探索“数据、平台、应用、终端”四位一体的新型商业模式,促进产业发展。重庆市提出要在民生服务、城市管理和电子商务、工业制造、交通物流、商贸零售、金融、电信、能源、传媒等数据量大的行业,以及外包服务等重点领域开展大数据示范应用。北京中关村则提出,在科学计算、资源勘查、卫星应用、重大装备制造、现代农业等领域应用大数据,服务国家战略需求。鼓励在治理大气污染、缓解交通拥堵等方面探索基于数据驱动的精细化管理模式,促进首都经济社会发展。围绕现代服务业发展需求,推动大数据与商业、金融、文化、教育、医疗等领域相结合,提升产业内生创新驱动能力,加快商业模式创新,促进优质服务资源更广泛惠及民生。在工商、财政、税务、统计、社保、城市管理、公共安全等领域,推动大数据解决方案应用,搭建智慧城市大数据公共服务平台,加快中关村示范区智慧政务和城市管理物联网建设。支持基于大数据的网格化管理、安监与应急管理、疾病防控、环境监测、分布式能源利用等公共服务示范,以及在经济预测、公共政策制定等方面的示范应用。推进中关村示范区政务数据的挖掘、开放与共享,创新宏观经济和社会管理的研究分析模式,提高公共服务科学决策能力。
大数据对信息系统的数据处理和挖掘能力提出了巨大挑战,需要新技术将庞杂无序的数据进行清洗、分析、预处理和集成,变成有用的信息。目前,我国这些技术的基础还比较薄弱,在如何有效利用新技术,通过数据分析来支撑政府决策,提升企业竞争力方面,与国外相比还有较大差距。
我国企业内部数据孤岛和碎片化现象严重,数据生成和处理不规范,企业数据不准确、数据缺失、数据质量差、数据可用性低等问题较为常见,对大数据应用造成很大的制约。此外,企业很多业务部门没有清晰的大数据需求,大数据服务提供商又未能在短期内开发出成熟的行业解决方案,致使企业级大数据陷入需求不明无法推出成熟产品,没有成功应用无法积累更多数据,没有有效数据又挖掘不出需求的恶性循环。
体制机制障碍的存在,以及数据所有部门的“数据私有”习惯,使得政府部门掌握的数据难以向社会服务机构和企业公开,业务部门与信息化部门间的数据交流不畅。数据的“流动性”和“可获取性”较差,给大规模数据的集成造成阻碍,使已有数据的价值难以发挥和展现。
与信息技术其他细分领域人才相比,大数据发展对人才的复合型能力要求更高,需要掌握计算机软件技术,并具备数学、统计学等方面知识以及应用领域的专业知识。目前我国可承担分析和挖掘的复合型人才、高端数据科学家以及管理人才存在很大缺口。
从大数据技术的发展历程上可以看出,大数据核心技术如分布式存储、云端分布式及网格计算均是依赖于开源模式,即通过开放式的平台,吸引全球开发者通过开源社区来进行代码的开发、维护和完善,从而集全球智慧推动大数据技术的不断进步,当前全球各大企业加大了对开源社区的赞助和智力投入,开源社区在大数据技术进步中将占据核心地位,开源模式将成为大数据技术创新的主要途径。
同时,大数据的技术发展与物联网、云计算、人工智能等新技术领域的联系将更加紧密,物联网的发展将极大地提高数据的获取能力,云计算与人工智能将深刻地融入数据分析体系,开源模式在新技术的发展中举足轻重。
大数据技术已经在商贸、交通、城市管理等多个领域中得到了应用,各产业领域未来的发展方向几乎都能和大数据挂钩,大数据产业正成为社会各类资源的聚集地。随着大数据产业的不断成熟,其对社会资源的吸引力将进一步加大。
各国政府均将发展大数据作为推动信息技术产业发展的重心,大数据成为“政策资源”的聚集地。美国、欧盟、日本、韩国等发达国家及地区均将发展大数据作为重要的国家战略,印度、俄罗斯等国家更是将发展大数据产业视作实现经济赶超的黄金机遇。
中小微企业和创业者对大数据热情高涨,大数据成为“智力资源”的聚集地。当前,越来越多的中小微企业和创业者投身到大数据产业,力图依靠新兴技术获取快速发展。
社会各界加大了对大数据的投资,大数据成为“金融资源”的聚集地。近年来,全球各大企业对大数据的投入不断增加,不仅设立自己的大数据研发和应用中心,还通过并购等方式加大对大数据产业的布局。
数据驱动创新源于大数据的基础技术体系。在大数据技术体系中,数据的采集是一切的基础,而数据存储、分析、可视化均与数据模式紧密相关,传统的结构化数据将不再成为大数据中重点关注的内容,而大量存在的非结构化数据和半结构化数据带来的技术和应用领域是大数据的蓝海。多样类型的数据分析、复杂的数据组合、多源的数据融合等问题将成为大数据创新的重要聚焦点。
应用驱动创新源于大数据的价值释放机制。大数据应用的基础是数据的采集、存储等环节,而大数据的市场价值主要体现在对海量数据的分析和可视化。在不同行业中,大数据应用需求也不尽相同,数据的分析手段、可视化方式均有所区别,因此符合实际应用需求的价值获取将是未来大数据关注的重点,应用将驱动大数据解决方案提供商采取不同的数据源,使用不同的数据分析方法,进而推动产业创新。
大数据正处在快速发展期,市场上呈现出各类企业竞相参与共同发展的态势。随着大数据的不断成熟,市场格局也将随之变化,呈现截然不同的态势。
在数据采集领域,互联网企业根据自身的优势展开激烈的竞争。大数据数据源主要来源于三个方向:互联网数据、政府数据和企业数据,由于后两类数据的采集主体一般不变,市场相对稳定,而对于互联网数据,全球各大互联网企业已经认识到数据的价值,将在数据获取入口等方面展开激烈的竞争,小型企业在该领域很难有所作为。例如,我国百度、腾讯、阿里分别重点掌握着搜索、社交和电商数据。
在数据存储和交易领域,市场将呈现平台化发展趋势,大型企业将占据一定的优势。未来,随着云端数据中心的不断推进和企业存储能力的开放,数据存储将会更趋于集中,大型数据平台将应运而生。在该领域,传统大型IT企业和大型互联网企业将依靠其技术能力和数据资源,占据绝大多数的市场份额。
在数据分析和可视化等领域,市场将呈现多样化、定制化发展趋势,各类企业特别是中小企业将成为市场的主力。一方面,大数据技术的开源特征和企业级计算能力的开放使得大数据分析的技术门槛逐步降低;另一方面,应用需求的多样化使得定制化服务成为主流,小型企业能够获得更多的市场发展空间。当前,很多大数据创业企业均是针对该领域企业,为其提供各类多样化、定制化的服务方案。
(本稿件由中国电子信息产业发展研究院软件产业研究所提供)