购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

1.4 大数据与信息资源管理

1.4.1 大数据与智慧数据

当前,大数据作为重要的生产要素之一,已经渗透到各个行业和领域。从大数据主要发展节点来看,“大数据”一词于1980年出现在《第三次浪潮》一书中,该书将“大数据”称为“第三次浪潮的华彩的乐章”。2008年9月,《自然》杂志推出了名为“大数据”的封面专栏。2011年6月,麦肯锡发布了关于“大数据”的报告,正式定义了大数据的概念,后受到各界关注。2012年,美国奥巴马政府在白宫网站发布了《大数据研究和发展倡议》。由于大数据的快速发展,2013年也被广泛认为是中国的“大数据元年”。2015年10月,我国正式提出实施“国家大数据战略”,标志着大数据战略正式上升为国家战略,开启了大数据建设的新篇章。大数据时代的主要发展历程如图1-4所示。

图1-4 大数据时代的主要发展历程

大数据具有4V的典型特征,具体如下。

第一,数据量大(Volume)。超大规模是大数据的基本特征,大数据时代的数据计量单位从TB跃升到PB(1024TB)、EB(1024PB)或ZB(1024EB)。其中以非结构化数据增长最快,其数据量是传统数据仓库的10~50倍甚至更多。

第二,类型繁多(Variety)。海量的数据并非具有规整统一的结构,随着数据来源增多,数据也逐渐多样化,从类型来看包括网络日志、音频、视频、图片、地理位置信息等,从结构来看包括结构化、半结构化、非结构化数据,从形式来看包括图像、音像、视频等,异构、多样的数据缺乏明显模式、连贯的语义,对数据处理能力提出了更高的要求。

第三,价值密度低(Value)。从整体来看,类型繁多、超大规模的数据的确蕴含着规律和模式,但少量数据并不能揭示这样的规律,也就是说大数据价值密度相对较低,在海量数据中同时存在大量不相关的甚至是干扰的信息,如何通过强大的机器算法更迅速地完成数据的价值提炼,是大数据利用亟待解决的难题。

第四,速度快、时效高(Velocity)。我们知道信息是具有时效性的,过时的信息其价值会大打折扣,甚至毫无用处,因此,在大数据处理过程中,不仅不能因为数据规模、复杂结构延误处理时间,反而应该实时、快速地进行数据处理和分析,满足相关主体需求。持续、连贯地进行数据的输入、处理和分析,实时而非批量,这是大数据区别于传统数据挖掘最显著的特征之一。

大数据使得基于大数据的数据挖掘和知识发现成为可能,推动了研究范式和服务模式的发展,科学研究从问题驱动转为数据驱动(见图1-5)。另外,大数据的产生和发展正在对实际的管理活动产生影响,并进一步提高了管理与决策的准确性。

图1-5 从问题驱动到数据驱动:“大数据”发现与预测

基于大数据的资源观和管理的视角,可以认为大数据是一类能支持管理决策的重要资源。大数据资源管理的特征主要表现为复杂性、决策有用性、高速增长性、价值稀疏性、可重复开采性和功能多样性六个方面。

①复杂性。大数据是海量的数据集合,它的形式、特征十分复杂多样。这不仅表现在数据规模大、数据来源广和形态结构多,还表现在其状态变化和开发利用方式等的不确定性。

②决策有用性。大数据自身是客观的、低价值密度的数据资源,其直接功用和价值比较有限。它的价值主要通过对其背后隐藏的信息进行分析、挖掘来实现,进而在实践情境中提供利用价值、支持决策,这就是大数据的决策有用性。

③高速增长性。大数据资源与石油等自然资源不同,不可再生的自然资源会随着人类开采利用而逐渐减少,但对数据资源的开采,非但不会减少其资源总量,反倒会增加,这种增长的速度可以很快,有时是指数性的,有时甚至具有爆发性。

④价值稀疏性。大数据具有低价值密度的特征,大数据的开发、利用也具有价值稀疏性,这也增加了开发和利用大数据资源的难度,成为大数据价值挖掘的主要挑战之一。

⑤可重复开采性。自然资源的开发、利用过程通常是不可重复的,但大数据资源可以被重复开采。任何拥有数据使用权的人或组织都可以对其进行开采。在这个重复开发的过程中,数据资源的价值会随之大大提高。

⑥功能多样性。不同主体可以基于不同的开发目的,对大数据进行开发,基于不同的开发目的和方式,赋予了数据资源多样化的功能,如公共管理、商业分析等

另外,“智慧数据”是近几年来的新提法,即通过对任何规模的可信的、情境化的、相关切题的、可认知的、可预测的和可消费的数据的使用来获得重大的见解和洞察力,揭示规律,给出结论和对策 。不同领域对智慧数据的理解会有所差异。在数字人文领域,智慧数据更加强调语义互联和专题数据库建设等内容,例如国际文化历史项目“文化历史的网络框架”,通过关联维基数据、艺术家辞典、艺术家联合人名规范文档等多个来源的数据,重现了跨越三千年的欧美文化迁徙模式。在智慧城市领域,智慧数据则倾向于强调数据的透明性、协同性、开放性、安全性等。实际上,智慧数据本身就是大数据的升级与延伸,其基本逻辑路径和目标是促使大数据更加智慧、智慧数据更大,以此实现数据与智慧的充分结合。

1.4.2 大数据对信息资源管理的影响

当今社会已经不是传统意义上的数据匮乏的时代,最显著的问题在于如何在海量的数据中找到真正需要的数据。可以说大数据概念的出现影响了各个层面的信息资源管理活动,包括国家、政府等宏观层面,各种企业、组织的中观层面,以及公众个体的微观层面。

大数据对具体的信息资源管理领域产生了潜移默化的影响。例如,从空间结构来看,在2005年以前,一般认为政府是信息资源的最大存有者(80%左右),信息机构(信息中心和图书馆等)是信息资源体系的核心节点,而2011年麦肯锡公司的报告显示,政府拥有约848PB数据,约占数字信息资源总量的12%左右,信息机构的信息资源总量更是远远低于信息服务商的数据总量,因而大数据环境下信息资源的空间结构分布更加扁平化和多样化。从流程管理来看,一直以来信息资源管理理论集中于信息资源的采集、加工和处理阶段;而大数据环境更加凸显了数据产生的管理(物联网)、数据汇集和交换效率(云计算)以及数据存储(云存储),并使得不同生命阶段的数据之间的内部关联性大大增强,信息生命周期模型逐渐从一个描述信息资源管理理念的“概念模型”演变为可行的“架构模型”

总之,在大数据、智慧数据等思维和技术的持续影响下,信息资源管理范式也发生了重要改变。大数据对信息资源管理的影响主要表现在以下四个方面。

一是信息资源观的改变。信息资源管理的研究对象和领域边界逐渐向数据资源延伸,开始重点关注数据资源的建设与管理问题。在理念上,数据资源的建设与管理更加强调“大”与“智”的结合,通过合理的方式、途径、机制实现资源的跨界融合。

二是信息资源管理的学理范式发生了变化。随着数据驱动知识发现范式的兴起,信息资源管理领域的知识发现“路径”开始缩短,信息分析流程也发生了改变,并更加重视因果关系与关联关系的结合。在内容层面,信息资源管理的学理研究更加注重片段数据、海量数据、非结构化数据的采集、清洗与分析,数据资源的开放化、关联化、可计算化水平成为新热点。

三是信息资源管理应用逻辑的转变。自从有了数据利器,信息资源管理更加强调“数据增值”和数据驱动的智慧服务,开始不断面向需求积极向用户提供数据产品、数据工具、数据培训,不断释放“数据红利”。

四是研究团队的变化。在大数据的影响下,数据分析类人才十分抢手,信息资源管理研究团队开始与大数据团队不断加强结合与协作,进一步推进具有信息资源管理领域特色的专家智慧协同。

总体来看,不可否认,大数据从各个方面推动了信息资源管理的发展,正在影响、改变乃至重塑信息资源管理的研究范式和应用逻辑,成为信息资源管理整体体系的重要补充,具有不可估量的潜力。当然,在大数据环境下,信息资源管理的传统优势和社会使命仍然没有改变,而优化社会数据资源配置效率、维护数据服务的公益性等成为新的重要目标。

1.4.3 大数据时代信息资源管理的新领域

大数据的飞速发展与信息资源管理发生了碰撞,摩擦出许多新兴的“火花”,发展出许多信息资源管理研究的新方向。

例如,在数字人文方向上,信息资源管理领域积极利用大数据环境下的各类新的信息处理技术,使得数字人文研究在本领域蓬勃兴起,数字人文研究内容、发展形态、项目建设等也注入了很多新的元素和内涵。在具体应用上,如:数字记忆,即运用新兴数字技术对承载记忆属性的档案资源进行开发、利用的一种建构活动;城市记忆,即集合城市历史、文化,运用大数据技术进行城市形象表达等。

在大数据环境下,社交网络的开源数据资源等逐渐成为可感知的、可观察的“社会信号”,大数据与社会计算成为重要方向。目前相关研究内容涉及虚拟社会网络的人物节点分析、互联网信息传播、学术交流模式、行为动机等。

在大数据环境下,各种安全隐患和风险错综复杂。对国家安全大数据信息资源的整合与管理,以及相关的挖掘、分析,是国家安全管理与决策的重要方向。目前其主要研究方向有面向国家安全事件的数据分析、学术信息资源安全保障、关键数据资源安全管控等。

大数据同时也是新型智慧城市建设的生命线,信息资源保障、解决“信息孤岛”和“数据孤岛”、提供数据驱动的智慧服务等成为其重要内容。例如,辅助城市应急管理、勾画区域产业发展态势、改善居民信息困境等内容和方向,都是信息资源管理领域将大数据与智慧城市进行融合的典型示范。

总体来看,在大数据环境下,信息资源不再局限于人脑所存储的知识和文献层面的内容 。信息资源管理正在从文献信息资源拓展到更广泛的大数据资源空间(如科学大数据、政府大数据、应急大数据、健康大数据等),并在国家安全与国家发展决策等多个领域得到广泛应用,体现出巨大的社会价值和无限的产业空间。

复习思考题

1.请从信息链视角分析信息流运动的内在逻辑。

2.信息的基本特征有哪些?

3.请谈谈对观点“信息资源是一种重要的生产要素”的理解。

4.请论述信息资源管理的产生与发展脉络。

5.请谈谈大数据对信息资源管理的影响。

6.请结合某个具体领域论述大数据时代的信息资源管理的拓新。 TYs//rYRNm/bbH3MSS3aQRPU5REVgcv2h9SDBGiQqyjOcwMrY4tIe9lF6EBg5j01

点击中间区域
呼出菜单
上一章
目录
下一章
×