推荐系统在高校图书馆中的个性化应用研究

2017-04-14 13:56孙常丽孙达辰郭冬梅武丽影

中国市场 2017年4期

孙常丽++孙达辰++郭冬梅++武丽影++金松跟

[摘要]文章概述了高校图书馆荐读系统的发展现状，对推荐系统中的核心技术——推荐算法进行了探讨分析，同时进行了高校推荐系统地推荐模式的创新性设计，简述了基于局部数据推荐模式的实现过程，对国内图书馆提供推荐服务的未来做出了展望。

[关键词]高校图书馆；推荐系统；推荐技术；推荐算法；推荐服务

[DOI]1013939/jcnkizgsc201704221

高校图书馆拥有丰富的藏书资源，是知识和信息的集散地，但是在知识爆炸的时代，移动设备频频更新换代，读者阅读行为已经改变，如果图书馆不能推出新的面向读者的服务方式，高校图书馆将无法很好发挥其资源的优势。在这种环境下，文章提出了在高校图书馆领域构建基于局部数据的图书荐读系统（推荐系统），既能很好地满足广大师生的信息需求，同时也能够通过这种主动推荐的模式帮助更多师生节省查找图书资料的时间，提高工作学习效率。

1推荐系统在国内外的发展现状

近年来，推荐系统在各个领域内逐渐兴起，并得到越来越广泛的应用，1992年12月，美国施乐公司研究所开发了最早的推荐系统Tapestry；[1]1994年，GroupLens系统可以根据用户的兴趣推荐相关的网络新闻的文章；之后又出现了Citeseer等应用于不同领域的推荐系统；近年来，很多网站可以为消费者提供个性化推荐，其中，最著名的是亚马逊电子商务网站，它采用的是条目对条目的协同推荐算法；目前，在图书馆领域应用推荐系统的比比皆是，除了各自采用不同的推荐方式之外，目的都是为读者提供更快、更好的信息推送服务，其中斯坦福大学的Fab推荐系统，它将基于内容和协同过滤算法结合起来，采用混合推荐技术为特定用户进行推荐；加州大学的Melvy推荐系统，它采用了两种生成推荐系统的方法，一种是利用图书馆的流通数据进行推荐，另一种是基于相似性的推荐；美国俄勒冈的SERF推荐系统是一种通过写作过滤的新型搜索引擎；在国内，虽然也有高校图书馆推出了推荐系统，但并不普遍，其中中国人民大学图书馆的推荐系统比较成型，它同样采用了混合的推荐模式为读者推送书目信息。

综上所述，推荐系统在国际上已有成熟范例，而国内图书馆领域仍属于起步阶段，需我们各大高校共同努力，实现图书馆领域的智能图书推荐，并且可以为相似领域提供一定的参考思路。

2高校图书推荐系统的个性化推荐模式探讨

图书推荐系统的主要推荐模式有三种：个性化推荐、智能化检索和社会化推荐。[2]其中智能化推荐需要利用大数据和云计算技术构建一个强大的互动知识分享平台，社会化推荐旨在解决用户在网上书店的社交网络需求，而对于高校图书馆而言，目前，仅仅实现了低级信息化，图书数据的元数据不多，使得图书的全文检索功能受到限制，而且高校图书馆有其自身藏书特点，专业书籍占藏书比例相对要高，由于读者水平及其专业各不相同，使得图书馆中大部分书籍成了摆设，无人问津，为了解决以上问题，本文尝试采用个性化的推荐模式来构建高校图书馆领域的图书推荐系统。[3]

目前，推荐系统在各行各业中应用广泛，其核心算法已经基本成熟，个性化推荐是将协同过滤推荐算法应用于高校图书馆领域，其基本思想是为一个用户找到他真正感兴趣的内容的最好方法是首先找到与此用户有相似喜好的其他用户，然后将他们所喜好的内容推荐给当前用户，该思想类似于现实生活中的“口碑传播”（word-of-mouth）。它是在用户对于一些项目或新闻资讯的评分或可以表达用户喜好的行为的基础上，查找具有相同兴趣爱好或行为的用户，以此来为目标用户推荐一些他们可能会感兴趣的资料的技术。协同过滤推荐算法是目前较常用的推荐技术，它的计算所依赖的原始数据都是用户数据评分矩阵，根据我们的经验，协同过滤算法可以基于相似用户的历史行为获得更多“不知晓”的项目，它的优点是不需要对物品或者用户进行严格的建模，且不要求物品的描述是机器可以理解的，与领域无关的，而且它计算出来的推荐是开放的，可以共用他人的经验，很好地支持用户发现潜在的兴趣偏好，且发现速度更快；这种推荐方法随着时间推移性能会提高，且其推荐个性化、自动化程度都很高，能处理复杂的非结构化对象；但是，这种方法存在稀疏性问题、可扩展问题和新用户问题，其推荐效果取决于历史数据集，且系统刚开始时推荐质量较差。

这种方法不同于其他算法，在国内应用不多。文章将采用个性化推荐模式，主要是根据《中图法》对图书馆中的图书类别按照分类号进行划分，同时根据读者的借阅习惯划分出相似读者群，并为读者找到具有更为相似借阅习惯的近邻读者，对其进行图书推荐服务，这种推荐模式可以为读者提供相同及不同分类号的图书推荐服务，同时还提供近邻读者推荐，一方面，对读者推荐可能感兴趣的作者及其作品，另一方面，对作者推荐相似读者及其图书兴趣。其主要推荐过程为：①数据预处理：将得到的数据按照运算模式进行预处理；②数据处理：通过已经设计好的个性化推荐体系将得到的预处理数据进行数据加工处理，得到备用数据集；③数据测试：将数据集代入个性化协同过滤模式中进行数据测试；④评分：进行计算并得出有意义的评分集合；⑤进行推荐：根据我们得到的评分集合来进行图书推荐。[4]

3推荐方法的创新设计

在采用个性化推荐模式的基础之上，文章创新性地提出了基于局部近邻搜索的思想，即基于局部用户数据（User-Based，CF）的协同过滤推荐算法来构建图书推荐系统，该算法是假设如果某些读者同时喜欢某一专业或某一类别的图书，那么他们对其他专业或类别的图书的喜爱也比较相似，即评分相似。高校由于其按专业进行划分的这种特点，在挑选图书时，相同专业的读者往往会挑选相同或相似类别的图书，因此，我们在进行推荐方法设计时创新性地采用了读者局部数据，即采用相同专业的读者借阅数据来进行图书推荐服务，这种方法区别于以往的利用全校读者的借阅数据来发掘读者潜在兴趣，提供推荐服务的模式。

这种基于创新图书推荐方法的图书推荐服务的实现，需要我们根据读者所属专业的不同将图书馆中读者借还数据进行分类，并计算相同专业不同读者之间的借阅相似度，我们需要根据这种相似度的高低来找到目标读者的K个最近邻居，在这一过程中将采用最近邻方法进行筛选。同时，我们将读者借阅相似度作为权重得出预测评分，这需要计算最近邻居对未评分项目的加权平均值，对得到的预测评分进行排序，将评分较高的项目作为目标进行推荐。这种方式的推荐结果推荐精度高、且具有推荐对象多样化等优点。

4结论

将推荐系统应用于图书馆領域，可以提高图书馆现有资源的利用率，节省读者查找所需图书资料的时间，为高校教学科研提供极大便利。目前，国内很少有成熟的推荐系统应用在高校图书馆领域，由于构建推荐系统的算法多种多样，各具优势，各大高校应该根据自己院校的特点进行选择，适当创新，以促进推荐系统在未来高校图书馆中的发展应用。

参考文献：

[1] Goldberg D，Nichols D，Okibm，et alUsing Collaborative Filtering to Weave an Information Tapestry[J].Communications of the ACM，1992，35（12）：61-70

[2]张闪闪，黄鹏高校图书馆图书推荐系统中的稀疏性问题实证探析[J].大学图书馆学报，2014（6）：47-53

[3]姜志英基于数据挖掘的数字图书馆个性化推荐算法研究[D].秦皇岛：燕山大学，2007

[4]杨玲图书推荐服务系统构建与应用研究[D].广州：华南理工大学，2014