近年来,数据挖掘引起了信息产业界的极大关注,主要原因是信息化的高速发展产生了大量数据,这些数据可以被广泛使用,并且迫切需要将其转换成有用的信息和知识 。随着图书馆数字化与信息化的不断加深,数据挖掘也成为图书馆界研究的热点问题。数据挖掘是一种数据处理方式,是指从大量的数据中通过算法提炼出有实际意义的数据并对其潜在属性进行分析和推断,搜索隐藏于其中的信息并加以高效利用。
高校图书馆本身就是一个大数据的生产者。进入21世纪以来,随着信息技术的高速发展和信息化的盛行,图书馆在这一进程中积累了大量数据。其中包括读者记录、书目记录、馆藏记录、流通日志、馆藏统计报告、流通活动报表等,以及电子阅览室上机日志、研究室管理系统日志、自助文印系统日志、图书馆通道机进出馆日志等。数据的活力与价值在于数据交换中各类数据的联动,数据挖掘则透过事件的表象发现隐藏在背后的蛛丝马迹,从而找到潜伏的规律以及看似无关事物之间背后的联系,以此来洞悉未来。图书馆的数据具有多样性、复杂性的特点,如何对这些数据进行收集、提炼和挖掘,为图书馆的管理决策和服务提升提供数据支撑,成为图书馆数据服务的关键内容。