“大数据”从2013年已成为现今学术界研究的热点。从2013年1月到2015年5月在中国期刊网(CNKI)中以主题词“大数据”检索,共有文献高达16538篇,将“大数据”、“图书馆”作为主题词中间用检索逻辑词“ and”连接组成检索式进行检索,共有文献539篇。将“大数据”、“高校图书馆”作为主题词中间用检索逻辑词“and”连接组成检索式进行检索,共有文献115篇。现综述如下:
在研究文献中,研究者一般都对大数据的内涵、特征、原理等基础理论知识进行大致相同的描述,在此不赘。研究者认为大数据给图书馆带来前所未有的机遇和挑战,樊伟红等提出,大数据给图书馆发展带来的机遇是:建立风险模型、用户流失及价值分析、建立新型知识服务引擎、预测资源故障、建立更智能的资源智能组合方式、智能分析及智能辅助决策等,同时带来了存储及计算能力、数据分析能力、基础设施和人力资源等方面挑战;韩翠峰认为,用户数据分析、处理和预测是大数据时代图书馆面临的挑战;容春琳认为,大数据有助于公共图书馆完善新的知识服务方式和拓展公共服务,但对数据存储能力、计算能力和隐私保护等提出挑战;李白杨,张心源提出数字图书馆建设中的数据存储、数据处理和数据分析的实施方案,以应对大数据对数字图书馆发展的挑战;程莲娟总结了美国图书馆界应用大数据的经验:政府主导支持研发,非营利性机构和高校积极利用开展公共服务,图书馆界积极加入开展合作;陈超认为,面对大数据发展,传统图书馆有着更艰巨的“从数字化到数据化”的深度信息化转型任务,图书馆要将数字化进行到底,内容、服务与管理都要全面数字化,在数字化的进程中同步考虑和兼顾数据化问题;张兴旺认为,要促进技术体系、人文情怀和服务理念等相互渗透和有机融合,从而构建图书馆大数据生态体系。
以上研究表明,大数据不仅是颠覆当今图书馆模式的技术、需求与机制的“破坏性技术”,更是一种推动图书馆变革的新思维新方法,它促使图书馆人展开“图书馆学的想象力”——一种通过观察、感知与图书馆相联系的社会文化技术变迁来增进理性、把握图书馆发展趋势的独特心智品质,思考图书馆在大数据时代所处的历史方位、社会价值和未来发展。
大数据推动图书馆发展形态转换。对大数据时代图书馆形态转换的研究主要包括智慧图书馆建设、下一代数字图书馆和新一代图书馆服务系统等。作为未来图书馆的新模式,智慧图书馆是以数字化、网络化、智能化的信息技术为基础,以互联、高效、便利为主要特征,以绿色发展和数字惠民为本质追求的图书馆新形态。王世伟认为必须借助大数据完成图书馆数据库的重组再造以及管理和服务升级,实现“腾云驾物”,图书馆将迎来充满智慧的数据管理、数据服务和数据创新的时代;祝森生提出,整合移动技术、物联网技术、体感技术、人文数字技术和语义检索技术、数字挖掘等是智慧图书馆建设的主要技术;陈臣构建了以人为本和以用户需求为主导、为读者提供个性化智慧阅读服务、实现资源和服务的高度融合的个性化智慧服务体系。
周杰等认为,下一代数字图书馆是面向智能化、语义化、知识化、模块化和自助化发展的数字图书馆,主要体现在语义出版、数据知识组织、移动阅读和分析统计四种发展趋势;殷红,刘炜认为,具有全媒体资源管理能力、完整的业务流程管理能力和全网域资源发现能力的新一代图书馆服务系统已崭露头角;进而,刘炜等提出,互联网使人类知识成为连为一体的大数据,而关联数据技术使人们能够借助信息技术发现知识,从而赋予图书情报工作者从事真正的知识服务的能力。不管是下一代数字图书馆还是新一代图书馆服务系统,研究者认为都需要借助大数据对非结构化海量数据进行业务流程再造和平台开发,提供对资源发现服务。
综上所述,大数据正在推动图书馆形态转变,使图书馆不仅作为实体型态、管理载体和既有服务模式的存在,而且面向大数据时代实现华丽转身和代际更替,关注数据本身,关注数据关联中的知识和智慧。这与卢胜军等将大数据时代钱学森情报思想称为“大成智慧”相契合,大成智慧的核心就是将所需要的古今中外的知识、信息、数据予以检索、激活和调用,大数据时代图书馆提供“大成智慧”。
大数据为图书馆服务的发展注入新的活力与动力。杨海燕、韩翠峰认为,图书馆数据处理方式、服务的策略、方式和实现路径均发生改变,利用大数据技术去挖掘、识别、组织与分析用户诉求是图书馆的服务模式创新的必由之路。研究者围绕图书馆信息服务特别是科研信息服务、知识服务和其他服务模式创新等内容开展研究。
在信息服务特别是科研信息服务创新方面,和婷以澳大利亚卧龙岗大学“图书馆立方”项目为例,认为图书馆信息服务创新应着眼于收集、存储相关数据,学习大数据思维;邓中华等在阐述大数据时代的科学研究第四范式——数据密集型科学或大数据科学的基础上,认为数据密集型科学用户的信息需求催生了嵌入科学研究过程的信息服务模式,它以专业的信息服务人员为基础,构建具有强大的资源整合能力、海量信息分析能力、大数据挖掘能力和多维度信息可视化能力的集成平台,以科研用户需求环境和需求趋势为导向,是面向用户发现问题、分析问题、解决问题和提供解决问题决策的信息展示、交互和推送的服务模式;白如江,冷伏海提出要整合集成大科学数据,实现科学数据共享与互操作性,构造基于科学数据的、开放协同的科学研究新范式;左建安,陈雅探索了实现科学数据共享的四种模式即国家政策驱动、部门之间交换、企业发展带动以及国际组织参与模式;侯经川,方静怡认为,规范化数据参考与引用行为重要性日益凸显,大数据时代来临以及数据密集型范式兴起推动孕育出知识计量学这一新学科。
在知识服务创新研究方面,秦晓珠等将适应大数据处理需求的新型知识服务模式定义为大数据知识服务,它是为适应信息服务业智慧化、协作化、绿色化、先觉化和泛在化的发展趋势而衍生的一种基于网络的、用以解决大数据多维度处理的信息服务新模式;大数据知识服务平台涉及的关键技术有大数据管理与处理技术,智能识别、传感与适配技术,全生命周期管理技术,终端交互技术,虚拟化接入技术以及平台标准规范、质量评价体和交易模型等;蒋勋,刘喜文认为,对大数据进行数据清洗是知识服务创新的有效途径,由此建立了包括准备、检测、定位、修正和验证五个步骤的数据清洗框架模型;孙卓构建了涵盖知识来源与过滤层、知识存储层、知识表示与标引层、知识处理与挖掘层、知识检索与反馈层的图书馆大数据知识服务引擎体系;刘江玲提出,运用大数据技术手段将资源整合、知识发现、信息推送融为一体的知识发现系统,实现知识价值再造。
在其他服务模式方面,陈芒等提出通过数据信息源整合、移动服务门户智慧化、全功能的个性化服务展示、一站式的全功能检索和用户增值体验推动图书馆移动服务创新;张兴旺等构建了一个面向多用户、基于主动服务的面向大数据的信息移动推荐服务模型,形成面向大数据的信息移动推荐服务的体系架构;崔慧红构建了基于大数据的合作式数字参考咨询服务(Collaborative digital reference service,简称CDRS)的知识整合研究框架;王天泥指出大数据为图书馆知识咨询服务带来了数据资源、分析技术、思想方法和合作渠道等机遇。
以上研究表明,大数据背景下的图书馆服务模式创新是研究的焦点,既涉及服务模式创新的一般理念,又初步探索了服务模式的内涵、模型、框架、关键技术和实现路径,集中体现了大数据推动图书馆变革主要领域。
图书馆应用大数据过程中面临着管理方式转变,研究者围绕大数据生态系统、数据管理及用户管理等问题进行了研究。郭自宽等认为,围绕大数据管理的各类新技术不断出现和进化形成了大数据管理的生态系统,进而提出了融合大数据获取、存储、组织、分析及决策五个阶段的图书馆的软硬件一体优化集成的大数据综合解决方案;温浩宇,李京京提出了基于非关系型数据库的中间件模型的数据集成方案,用于推动数字图书馆充分利用海量的异构数据进行知识挖掘、为用户提供决策支持等;曹霞提出根据高校图书馆的非结构化数据来源、格式、主体、流向四个因素构建了非结构化大数据管理模式,可以通过赋予四个因素不同的权重,利用因素评价矩阵,对各类大数据的优劣进行综合评价;应璇,孙济庆提出,通过对海量检索日志文件进行数据挖掘及关联分析,寻找用户检索过程中暴露的研究热点,词频分布规律,检索词相关度等,可以获得用户检索行为的高价值度以及价值数据挖掘的可操作性;陈俊等构建了一个获取电子文献有效因子数学模型,对大数据环境中的图书馆主动服务质量进行管理。
大数据背景下图书馆维护信息平等和隐私保护是研究的另一个热点。韩炜将大数据时代的信息不平等定义为数据不平等,认为其实质是信息控制权的不平等,并提出公共图书馆通过发展公共图书馆制度、倡导社会责任与社会包容和提供公共智慧服务等消除数据不平等。大数据环境下的数据挖掘、商业智能、追溯集成等技术给个人信息保护立法、监管、技术、行业、自我保护等带来了巨大挑战,在图书馆提供个性化服务过程中,用户隐私可能被侵犯。张文彦等提出,知晓读者的详细背景而又严控其传播范围,坚定地维护用户的个人隐私权,这就需要新时代的图书馆员具备更高层次的职业道德和专业素养。
上述研究表明,与大数据带来的巨大机遇相比,大数据推动管理方式转变是复杂的。面对新的信息生态系统、管理对象以及维护信息平等和隐私保护等新问题,研究者密切关注大数据技术发展进展,在管理变革的基础理论、可行性论证、标准制定等方面积极探索并初步提出对策性建议。
大数据推动图书馆事业发生变革的同时,也对图书馆学、情报学等相关学科产生深远影响,研究者围绕情报学特别是竞争情报、电子政务和学科建设等方面展开研究。李广建、杨林认为,大数据时代情报研究的发展趋势是全领域情报研究、综合利用多种数据源、注重新型信息资源的分析、强调情报研究的严谨性和情报研究的智能化五个方面,可视化分析、数据挖掘、语义处理是情报研究分析的三大工具;刘红霞,白万豪认为,大数据推动着应用情报学的研究环境、研究对象、研究方法以及工具等方面发生变革,拓展了在公共管理、商业、医疗以及环保等领域的应用;罗繁明,杨海深提出一种基于多级统计特征的关键词提取(TFIDF- SK)算法,可望在政府决策情报、企业竞争情报和研究情报监测中得到应用;刘高勇等认为大数据时代的竞争情报发展趋势是重心向移动互联网转移、更加重视动态竞争情报、云计算成为竞争情报系统的基础以及核心数据保护;陈强等提出了基于众包模式的竞争情报运行的逻辑框架,可以提升竞争情报的智力、成本、创新等核心优势;顾涛提出了大数据时代的自主协作、中心协作和分级协作等三种基本竞争情报协作模式,对三种模式进行不同规模和层次的整合可以为大数据服务和情报分析提供迅速融合的发展模式;黄晓斌,钟辉新,吴金红等对企业竞争情报的发展创新、系统模型进行了研究。
在电子政务研究方面,研究者围绕善的政府网站建设,追求合作,有效执行信息政策以及高层领导重视等措施,实现政府信息的着大数据背景下的政府开放数据进行了研究。陈美提出,美国通过建立信息自由保障和规制,完开放共享,推动开放政府的进程;曹凌阐述了欧盟开放数据战略是以构建开放、透明政府释放大数据的能量,以大数据为动力支持社会创新,以创新发展智能经济,摆脱金融危机,增长就业,实现社会治理的战略;迪莉娅构建了由采集、存储、联机分析、挖掘和可视化五个流程构成的基于云计算的电子政务大数据管理模式。此外,闫娜对信息管理与信息系统专业的学科建设,秦殿启对个人知识组织进行了研究。
以上研究表明,由于图书馆学、情报学、信息科学之间的强关联关系,大数据不断催生着新的研究内容、研究对象、研究方法甚至产生新的研究领域,拓展各学科交叉维度与深度。在推动图书馆相关领域变革方面,大数据展现出宽广的研究领域和广阔的应用前景。
通过对以上文献的梳理分析可以看出,关于大数据推动图书馆变革的研究发展迅速并取得一定成果,但仍处于起步阶段,尚存在如下问题:第一,理论研究有待进一步深入。对图书馆在大数据背景下变革的方向缺乏实际内容的支撑;研究还处在对大数据的引入介绍阶段,结合图书馆实践系统论证的相对少;一些研究将大数据理论与图书馆理论相拼接,逻辑性实用性较差;一些研究以大数据的面目出现,但纵观全文,其思维方式及提出的图书馆变革方案上停留在前大数据阶段;研究提出的解决方案的可操作性有待在实践中进一步检验和修正。第二,研究方法有待改进。研究的视野有待扩展,缺乏对国际性发展成果的研究借鉴;实证性研究匮乏,热衷于用大数据基本理论直接套解图书馆的组织结构,缺乏实践检验;缺乏多学科交叉、多角度透视的立体式、整体性研究规划。第三,研究力量分散,缺乏协作引导。研究分布分散,基本上处于单兵作战状态,没有形成研究集群;刊发期刊主要集中一些核心期刊,很多专业期刊处于“集体失语”状态;学术对话匮乏,研究者大多处于自说白话状态;专业协会和学术组织的引导作用有待进一步加强。
韦斯特认为,技术很少能够独自驱动伟大变革,数字技术的有效应用需要组织调整、政策改革、技术创新与保护人的和社会的价值观之间的紧密结合与良性互动,这对进一步推动大数据时代图书馆变革提供了重要启示。第一,加强基础理论研究。重塑图书馆学的想象力,不但要厘清大数据的概念、起源、基本理念、类型、特点以及与现有信息技术模式的区别,更要研究大数据与图书馆发展的耦合性,研究大数据与图书馆之间的亲和关系,使图书馆应用大数据符合社会、文化、技术和图书馆自身发展的逻辑科研主管部门、图书情报联合机构、图书馆机构要支持、引导和开展相关研究。第二,探索图书馆应用大数据的服务和管理体系。积极倡导并促成新的政府政策、管理标准、行业规范或组织文化的形成和出台,牢牢把握图书馆在大数据生态系统中的话语权和主动权,在大数据技术的关键领域进行政策制定、科研投入与发展转型;根据图书馆所处大数据环境的构建融人力资本、技术应用和需求满足相适应的图书馆服务模式;积极推动图书馆管理体制和业务流程变革,使之与部署大数据技术带来的图书馆机构与流程、人力资源数量与结构、质量检测与控制手段等变化相适应;积极推动商业化技术的去商业化,图书馆要积极引入大数据技术在商业领域中的成功经验为我所用,同时坚守公益服务本质;积极建立维护大数据时代的信息公平制度,消除大数据不平等,保护隐私权和数据安全。第三,建立符合大数据技术应用的人力资源体系。大数据技术应用需要新的人力资源体系与之相适应,数据科学家、大数据算法师、数据图书馆员和智慧图书馆员等新角色呼之欲出。不管采用何种称呼,新角色肯定要准确把握大数据的范畴、价值、状态,具备集成化的数据资源获取、存储、组织、分析和决策的综合解决方案的能力。