数字挖掘技术在图书馆中的应用

2017-03-06 21:54郑晓川
电子技术与软件工程 2016年23期
关键词:图书馆应用管理

郑晓川

摘 要

在数字信息时代,一个人要想完全不泄露个人信息是不可能的,而我们利用数据挖掘技术获取这些信息并进行分类整理和分析,就能为各领域的工作谋取相关的利益。本文仅从现代图书馆的建设出发,详细阐述数据挖掘技术在图书馆用户资源管理、书籍采购及摆放、个性化推荐服务三方面的应用,希望图书馆能在数据挖掘技术的辅助下吸引更多的读者,为读者提供更贴心、更优质的服务。

【关键词】图书馆 暑假挖掘技术 应用 管理

1 发现并管理用户资源

用户数据按数据类型可大致分为用户描述类数据、用户行为类数据、用户需求类数据和用户反馈类数据四个大类,随着数字图书馆的不断发展,图书馆在获取用户数据的渠道、速度、数量等方面也在不断优化,既可以通过传统方式获取,也可以通过现代化的方式即数据挖掘技术获得。

在数字图书馆服务过程中获取用户进入图书馆借书都会办理借阅卡,卡上除了有用户的基本信息如姓名、联系方式、借阅等级以外,还记录了他们在持卡期间所借阅书籍的名称、编号、分类、借阅时长等。

另外,现在的图书馆都配有电子检索仪器,借阅者在检索过程中所输入的关键字也透露着他们的阅读偏好,是一个有用的信息。但是搜索很多时候是匿名的,所以我们可以灵活地利用IP地址來代替读者标识,统计每台机器在相应检索时间内各检索字段的条数。所以在利用数据挖掘技术进行用户信息挖掘和管理的时候,我们主要要做的工作就是将每一个用户的基本信息与其所借阅的书目信息及检索历史一一匹配, 编辑入库、定时更新。之后再将这一个个的信息聚合,做好详细的分类,构建起一个专门的用户数据管理库。针对数据库中的用户数据,采用简单关联、时序关联、因果关联等关联分析与序列规则等数据分析与挖掘方法,对图书馆用户特征进行多维特征分析,挖掘用户的隐性信息需求,从而为下文中将要谈到的图书采购、藏馆布局、个性化推荐服务打好基础。

2 优化图书馆藏书和布局

图书馆的藏书可分为过往藏书和近期藏书,过往藏书的数量一般是近期藏书的数倍,占用的空间的大得多。但是根据借阅情况来看,过往藏书的借阅量远不如近期藏书,查找起来也相对费时费力。但即使是在近期藏书中,也存在着热门书刊和冷门书刊之分,图书馆每年的书刊购置费都是十分有限的,若盲目购置则会造成资金的浪费和书刊的闲置,资源得不到有效利用。

传统的图书馆在采购时大多通过出版社、书店等渠道来了解新书书目和销售情况,却没有实际针对本图书馆所面向的客户群做一个专门的分析,采购的意见也多由馆长或个别专家来决定,不可避免地带有强烈的个人意志。而利用数据挖掘技术,我们可以对网络上无序的、非结构的数据进行采集和分类,通过搜索量及舆论对新书的受欢迎程度做一个预计,同时根据本馆借阅者的借阅偏好整理出他们所喜爱的图书分类,加大该类目书刊的采购比例,利用有限的经费科学采购。

除此之外,时间也会对读者的借阅行为产生一定的导向性,比如在奥运会期间,运动、世界史、旅游等方面的书的借阅量就明显上升,各类考试的前期,其相关的辅导书刊的借阅量也会随着开考时间的临近而逐渐上升,所以图书馆在采购时要综合各方信息、充分考量,使经费最大程度发挥效益

另一方面,为方便读者查找书目、快速完成借阅,图书馆还可而利用数据挖掘技术对图书馆的借阅流通记录、检索请求、分类统计、文献拒借集、频繁借阅集、借阅时长、归还时间等数据进行分析,得到同一类目下书籍被借阅频率的高低并进行排序。那么我们就可以据此重新安排图书馆的书架布局,将借阅量大、借阅频率高的书籍放在显眼位置、靠近出入口的地方,这样不仅能节省借阅者的查找时间,也能减轻图书管理员的上下架强度, 一举两得。

3 为读者提供个性化的推荐服务

在图书馆巨大馆藏中,读者感兴趣的书目只有很小的一部分,虽然现代图书馆提供的检索服务能够帮助读者在输入关键词后在查询结果浏览到相关书目的信息,引发他们对其他书刊的兴趣,临时增加借阅量。但这行为的发生取决于借阅者的主动检索,图书馆对其行为的导向几乎不存在,处境十分被动。而图书推荐服务就是为弥补这一局限性而采取的主动向读者提供信息的方式,它降低了对读者的要求,同时提供了更丰富的信息。图书推荐服务是现代图书馆个性化信息服务中的一种,它旨在为读者推荐他可能会感兴趣的书目,以增加额外的借阅量,同时也可以起到引导读者关注某一领域发展的作用,如在人民代表大会期间,图书馆就可为读者推荐与革命历史、政治制度、名人自传等相关的图书,与这一特殊的时间点相结合就有可能激发读者本没有的阅读欲望,从而提高某类图书的借阅量,增加活跃度。

为了提供个性化推荐服务,我们可以通过对借阅记录中读者信息和书籍信息的关联分析,找出读者的阅读偏好和借阅习惯,获取“不同类型的读者喜欢哪类书籍”,进而建立模型并提供推荐服务,向读者推荐相关的专题信息。但需要注意的是,越新的借阅记录指导意义越大,因此我们可以在借阅记录中加入权重,将权重定于为事务发生时间的函数,设定当前时间的借阅记录的权重为1,越早的记录权重越低,使得最近的记录在挖掘中提供最多的知识。同时,我们还可以通过分类分析的方法,获取各类读者的特征,挖掘图书馆的潜在读者,先免费为他们提供感兴趣的信息或解决问题的知识,将其逐渐发展为稳定读者。

4 结语

图书馆承担着为读者提供阅读材料的重要角色,是书刊储藏的重要场所,但是在信息经济时代如何为读者提供他们所真正需要的阅读材料,吸引更多的借阅者来到图书馆,是图书馆管理者需要思考的问题。在数据挖掘技术的帮助下,图书馆对用户信息的采集和整理变得简单,这对图书馆采集经费的合理化使用和馆藏布局的优化有都很大帮助,将推动图书馆业务与管理的全面进步。

参考文献

[1]谢含.数据挖掘—未来图书馆参考咨询工作的新方法[J].高校图书馆工作,2006(01).

[2]赵雷.数据挖掘技术在高校图书馆中的应用[J].科技情报开发与经济,2009(07).

作者单位

南阳医学高等专科学校 河南省南阳市 473000

猜你喜欢
图书馆应用管理
枣前期管理再好,后期管不好,前功尽弃
图书馆