在大数据快速发展的环境里,传统落后的图书馆信息服务设施不适用于大数据技术的要求。由于大数据的发展,现在的传统图书馆是服务设施受到当前很多数据技术的严峻威胁。图书馆普通的文献书籍的信息通过数据库就能快速查询,可是对于复杂的数据信息,数据库还是无能为力。图书馆需要引进先进的数据管理技术才能满足大数据处理的要求。下面是较为常见的数据处理工具:Reduce是现在最受欢迎的数据处理工具,深得研究人员的青睐;Hadoop,因为其开源性和简便性的特点,是数据处理时第一时间考虑的处理工具;NotOnlySQL数据库存储技术,因为其可以存储多种模式的数据,存储数据时比较灵活。凭借这些技术作为大数据处理的前期支持,能够更好发挥大数据的优势。此外,图书馆的管理人员也需要与时俱进,不断进行新技术的学习,不断提高自己对数据库的应用能力,才能满足时代的需要。新时代也对图书馆管理人员提出了更高的要求:及时了解大众的偏好,提高服务质量与效率,更好地满足用户的需要。
图书馆信息分为三种类型:结构化数据、半结构化数据、非结构化数据。第一种类型是指图书馆的电子信息资源;第二种类型是指图书馆存储的用户借阅数据;第三种类型是指用户通过互联网进行阅读时发生的视频及语音记录。由于现在社会智能手机较为普及,用户可以在手机或电脑终端查询自己的借阅信息及个人信息等,用户通过自助终端进行阅览的数据都能被图书馆信息管理系统采集,图书馆通过大数据的应用将这些用户的数据进行科学管理。但是,由于用户数据的指数型增加,给图书馆数据管理带来了很大的困难。
1.数据存储
由于文件、图片、音频、视频等数据的不断增长,造成了知识库严重超载,因此对信息资源的有效管理便成为大数据时代主要解决的问题。对大数据的管理还存在许多的问题,首先,目前的信息咨询服务存储很难解决大数据的性能共享问题,原因是因为大数据结构太复杂,其中包含了结构化数据、半结构化数据和非结构化数据三种数据类型,想要对这些数据进行存储和共享都非常困难。其次,由于数据量的急剧增大,网络传输性能同样也会受到影响,采取怎样的措施来对文件进行管理和保护都是需要解决的问题。网络是一个开放的环境,信息安全随时都受到威胁,信息污染盗窃经常发生,因此对信息资源的保护是完成信息资源服务的基础。最后,长期积累下来的数据难免会存在很多重复的文件,它们所占的存储空间就造成了资源的浪费。因此大数据时代首先要解决的就是数据存储问题。
2.数据处理
由于云计算的应用,一些图书馆信息数据的存储空间不足的问题得到了较好的解决。可是大数据时代已经到来,要求有更高水平的信息存储与数据处理能力,以前的技术显然已经满足不了大数据时代的需求。由于大数据面对的是复杂的海量数据,不但数据种类杂乱,数据结构也复杂,传统的信息处理系统已不能对其进行完美的处理,当前的解决方法就是升级信息咨询技术。现行的大数据处理技术有Hadoop技术、MapReduce、NO-SQL、云计算等等,这些大数据处理技术都是在当前特殊情况下为了满足需要才被开发出来的。所以图书馆可以引进这种技术进行数据处理,以达到良好的图书馆信息服务效果。
3.信息安全
大数据本身就是数据,只要是数据就存在一定的安全问题。如今网络的开放、各种信息资源的共享,都可能存在信息安全问题,例如,图书管理员、用户、都存在知识的共享与交互,他们在进行知识共享和交互的时候可能没有注意网络环境是否安全,这样容易造成信息的泄露,对个人信息安全造成威胁。社会各行各业都有自己的知识产权、个人的隐私,因此在信息咨询服务中都可能存在信息安全问题。现在的数据信息安全和过去的信息安全问题有很大的区别,人们既想得到数据的开放,又想更大限度地保护自己的隐私,这使得在大数据时代必须让二者相互的保护和平衡,共同发展。
综上所述,图书馆为了适应大数据发展,对图书馆信息资源应该有一个调整,通过建立更加完善的大数据架构来保障信息咨询服务的方便性和安全性,从而可以为信息咨询服务打下了坚实的基础。以下是从大数据的采集、存储、处理和应用方面来构建的大数据架构,对数据进行分层处理,大数据的处理能够更好地解决信息咨询服务中的数据存储,数据处理和信息安全问题。如图1-3-3所示它表示了大数据时代图书馆新的数据架构。
图1-3-3 图书馆大数据架构
1.建立交互式共享平台
因为现在社交网站深受广大民众的喜爱,于是图书馆也开通了网络互动功能,通过交互平台能加强用户与图书馆的联系,还能增加图书馆的吸引力。图书馆以百度贴吧与天涯论坛等作为交互平台,在这里用户能够畅所欲言。通过这些互动平台,图书馆可以不断提高自己的服务能力,通过参考用户的反馈建议,搜集有价值的数据信息。图书馆还能将互动平台的资源进行整合,用户能够通过搜索功能快速搜索自己所需的资料并进行下载,还能将自己的研究成果上传到平台上分享给其他用户,这样的交流平台能够为科研人员带来帮助,为学术研究提供参考,并扩充图书馆的信息资源。显然,客户所上传资料的真实性不能保证,所以数据的筛选与考察是必不可少的一步,这样才能清楚虚假信息,保留真实有效的信息资源,这将是图书馆未来的发展趋势。
2.信息资源组织的转变
所谓信息组织是指信息工作人员采用信息技术对数据进行采集、加工、存储、和分析应用,形成一个可利用的系统的过程。由于大数据的数据结构复杂种类繁多,其中包括结构化数据、半结构化数据和非结构化数据,对这些数据进行处理存在一定的难度,传统的数据处理方式无法满足大数据时代的要求,只能采取更加个性化的方式来处理这些数据。如图1-3-4所示,表示的是大数据时代图书馆信息资源组织流程图,通过对数据源的处理,使得大数据呈现出一些规律,方便人们的使用。
图1-3-4 大数据信息资源组织流程图
3.对图书馆信息服务方式的影响
由于互联网技术的快速发展,传统的信息服务方式已不在适应当前的需求环境,图书馆应从进行新业务的拓展来提高自身的信息服务能力。第一,图书馆应搜集大量的包括图片、音频、视频等数据信息,经过恰当的加工扩充图书馆的信息资源。第二,图书馆选择互联网上的一些有价值的信息进行处理,以丰富自己的服务业务。第三,图书馆应利用互联网为用户提供一些不一样的服务,现在最流行的是定位服务,就像微信上的定位服务一样,开启定位就能确定位置并为用户推荐周边的各种服务项目,能给人们的出行提供很大的便利,这也是大数据发展的产物。用户终端还会向用户发送一些实时信息,能够让用户实时了解图书馆的最新动态,并为信息的后续查询提供便利。