读者利用图书馆数据指读者在图书馆进行各种借阅、学习等活动产生的数据,主要有馆藏数据、借阅历史记录数据、读者个人信息数据、读者进馆记录数据。馆藏数据包括图书馆馆藏书目的具体信息,如馆藏代码、馆藏类型、馆藏地点、馆藏状态、馆藏记录号码、馆藏索书号、馆藏条码、编目日期、文献形态、题名、主要责任者、版本、ISBN号等信息。馆藏可借阅文献类型主要为图书、随书光盘和影音资料。借阅活动包括借阅图书、归还图书、续借图书、预约图书,借阅历史记录数据记录了读者发生借阅行为的时间、馆藏记录号码、书目记录号码、借阅活动类型(借阅、归还、续借、预约)、读者号码(读者在自动化系统的唯一标识符)。读者个人信息数据记录了读者的姓名、学号、院系、读者类型(教师、本科生、研究生、硕士、博士等)、读者号码、建档日期、读者身份有效期限、通信地址、电子邮箱等,是图书馆保存的读者有效信息。以上数据均来源于图书馆自动化系统,而读者进馆记录数据来源于图书馆进馆门禁系统,通过读者刷校园卡进馆记录每次进馆行为,包括读者学号、姓名、读者类型、进馆时间、门禁闸机号。通过数据清洗,删除冗余、不完整和噪声较多的不科学、不准确的数据。然后将数据导出到SQLServer数据库中进行处理,将馆藏数据导出为馆藏库;将借阅历史记录数据导出为借阅历史库;将读者个人信息数据导出为读者库;将读者进馆记录数据导出为通道机库。导出后的SQLServer数据库表结构分别如表3-1、表3-2、表3-3、表3-4所示。
表 3-1 馆藏库数据表结构
续表
表 3-2 借阅历史库数据表结构
表 3-3 读者库数据表结构
续表
表 3-4 通道机库数据表结构