跨域图书推荐系统模型分析

2021-12-12 05:49杨玉枝
现代职业教育·高职高专 2021年47期
关键词:跨域协同算法

杨玉枝

[摘           要]  为解决推荐系统具有用户行为数据极度稀疏的问题,研究对跨域图书推荐系统模型进行了研究,通过在系统用户数据、推荐系统算法、内容与算法融合三个层面,结合图书馆图书的特点,分别对跨域图书推荐系统模型进行分析。结果表明,跨域推荐系统为图书推荐系统提供了丰富的理论支撑。

[关    键   词]  跨域推荐;图书推荐系统;模型分析

[中图分类号]  TP391.4                  [文獻标志码]  A                [文章编号]  2096-0603(2021)47-0104-02

推荐系统较好地帮助我们解决了信息量过载的问题,比如在商品推荐系统中,受限于个人的时间因素以及投入的精力限制,消费者常常仅与海量商品中极少部分的商品产生相互关联,容易引发推荐系统数据稀疏的问题。为了更好地克服并尽可能解决数据稀疏性问题,国内外学者们大多采用跨域推荐系统的方法,具体是通过取长补短的方式实现知识迁移,进而达到采用数据相对丰富的信息去弥补数据相对稀疏的目标[1-4]。

跨域推荐系统按照用户层面可以划分为:已知用户匹配的跨域推荐、不依赖用户的推荐、基于概率偏好模型的跨域推荐以及基于多视角神经网络的推荐。按照推荐系统算法的角度进行分类:基于内容的推荐,基于协同过滤的推荐、内容与算法融合的混合推荐以及基于迁移学习理论的推荐。该文以图书推荐为背景,结合用户层面和推荐系统算法的角度分别对跨域推荐系统进行阐述和分析,旨在为跨域图书推荐系统模型研究提供指导思想[5]。

一、用户层面的跨域推荐

(一)已知用户匹配

通过导入和整合相同图书跨域的评分数据,国外学者Berkovsky等人提出了非常经典的跨域推荐系统模型[6]。Lu[7]等人借用AdaBoosting弱学习器理论框架,用基于经验误差的信息筛查方式,有效地去除跨域推荐系统模式不一致的情况。Elkahky[2]等人提出了一种基于深度学习理论的内容跨域推荐系统MV-DNN,通过跨域的丰富内容数据共同映射到同一隐语义分布空间中。研究者通过整合图书之间的匹配信息,寻求在匹配信息之间的特征表征,更大限度地提高已知用户匹配的推荐系统的准确性。

(二)不依赖用户匹配

针对同一隶属平台,充分利用数据账号匹配信息方便的特性。著名学者Li[8]等人提出了以codebook为基础的跨域推荐系统模型CBT,该模型无需知道匹配学生跨域间的账号信息,仅仅通过学生或者图书的重叠部分信息可以作为推荐的重要依据。Chen[4]等人以矩阵分解理论为依据,提出张量分解思路,较好地解决跨域推荐的问题,目的是更好对隐因子进行分解,降低烦琐的二元关系转换表。通过不依赖用户进行学生和图书之间的匹配,较好地实现不依赖用户信息匹配的跨域推荐。

(三)基于概率偏好

基于隐语义模型的协同过滤算法目前越来越广泛,以PMF[9]模型为例,将学生和图书进行归纳,同步映射到不同层的隐聚类上,仅借助学生和图书的ID信息,另外凭借例如学生人口统计学特征和物品类别属性等信息进行辅助,最终通过概率偏好模型PPF,有效地解决隐语义模型存在的固有过拟合等问题。为继续丰富样本数据,较好地提升模型的精准率,采用跨域推荐模型,引入CMF[1]学习机制,隐向量权值共享,将引入的超参数模型拓展为贝叶斯概率生成模型,借助马尔科夫-蒙特卡洛算法求解,最终实现了基于概率理论的跨域推荐系统。

(四)基于多视角神经网络

神经网络可较好地解决特征提取的难题,尤其是在非线性特征的表征方面具有独特的优势,将跨域概率偏好模型与神经网络相结合[10]。例如以豆瓣平台为例,若在图书方面有兴趣爱好的用户,那么在电影推荐方面较大概率具有相同的兴趣爱好。进而可以推断,采用多领域间的内在联系可以较好地共享相同的隐语义向量信息,借助多视角用户信息的共享通道,不断优化多级训练的方式,大大地缓解了模型表现出的数据严重稀疏等问题。此外,通过不断对传统的推荐模型进行神经网络训练,较好地实现了特征难表征的难题,有效地增加了跨域推荐模型的自由度,同时也可以根据不同的实际场景,增加以及扩充更加复杂的神经网络模块。在充分挖掘神经网络特征表示的优越性的同时,实现神经网络的跨域图书推荐系统。

二、基于推荐系统算法的跨域推荐

(一)基于内容

基于内容的推荐[11],可以理解为基于历史行为数据对图书进行推荐,可以根据学生之前喜欢图书的相关信息,搜索与该图书相似度最高的图书进行推荐。推荐的依据来源于学生借书时留下的信息以及学生和图书关联信息,有效地获取学生的兴趣爱好。通常情况下,基于内容的推荐系统会出现数据丢失,通过分析数据分布的特点,可以得到原始数据的稀疏性以及离散性等特点,单纯通过内容的推荐,效果不佳。

(二)基于协同过滤

基于协同过滤的推荐[12],属于图书推荐与学生的兴趣相似度较高的推荐。协同过滤思路可以挖掘学生和图书之间的相似隐层关系,带来了丰富的内容信息,基于学生或者图书的协同过滤思想进行跨域推荐方法,可以进一步挖掘跨域推荐中丰富的语义关联信息。基于协同过滤的方案可以较好地弥补单纯通过基于内容的推荐系统的缺陷,有效地解决数据稀疏性等问题,目前协同过滤推荐系统算法已经作为当前学者研究的热点。

(三)基于图理论

基于图的推荐[13]可以有效利用图结构信息深度挖掘学生和图书之间的内部联系,进一步采用语义关系建立学生和图书之间的语义模型,较好地强化了跨域推荐的效果。图的理论可以较好地引入注意力机制模式,可以有效地挖掘数据与数据之间的相关性,进而弥补数据丢失的情况,当前研究较多的是基于图理论和协同过滤推荐算法的结合。

(四)迁移学习

迁移学习与跨域推荐系统的思想比较吻合,在图书推荐系统中,不同高校的学生行为数据具有相似性,可以通过获取开源的数据集,建立推荐系统模型后,将训练获取的模型参数成功迁移学习到研究的对象模型中,可以达到模型尽快收敛降低模型过拟合的风险。

三、基于内容与算法融合的跨域推荐

(一)模型架构

以高校学生为研究对象,学生对图书的反馈评价信息[14],图书本身的属性信息,具体分为四个步骤:提取内容信息的特征、获取相邻属性间的信息提取、构建异质图以及跨域推荐。模型架构的选取并非一成不变,可以根据实际数据的特点,进行模型架构的删减以及调整,在模型架构设计前可以对输入数据进行简要的数据分析,对每个步骤做必要性评估。

(二)提取文本信息特征

将反馈评价信息与图书的文本信息进行联合,最终获取模型所需要的特征。通过词袋模型的方法,将文本信息进行向量化表示,同时考虑词袋与词袋之间的相关性,引入注意力机制,采用深度学习的方法提取高纬度相关性特征。该方式与协同过滤推荐系统中的图优化比较类似,不同点在于该方案是以文本词袋理论为前提进行数据量化。

(三)提取相邻关系特征

通过矩阵评分的方法将学生和图书整合到相同的矩阵中,构建学生和图书的相邻矩阵,通过矩阵变换的相关矩阵论知识,对矩阵进行降维以及特征提取,最终获取相邻关系特征,相邻关系特征的好坏直接影响跨域推荐模型的精度,因此需要尽可能提高该步骤的精确度。

(四)跨域推荐

将文本特征向量和相邻向量进行融合,参考传统的构建异质图的方式,以学生对图书的评分指标为基础,构建学生和图书的节点信息,以及学生给图书打分的异质图的边界信息。最后借助图理论的相关知识,计算节点与边界的评分函数,进而实现对任意学生进行Top-N的跨域推荐,同步也会输出每个排序的概率值。概率越高的推荐对象,表明推荐优先级最高,反之推荐优先级最低。

四、结语

文章对跨域图书推荐系统模型进行了研究,通过在系统用户数据、推荐系统算法、内容与算法融合三个层面,再结合图书馆图书的特点,对跨域图书推荐系统模型进行分析,较好地解决了推荐系统具有用户行为数据极度稀疏的问题。

参考文献:

[1]SINGH A P,GORDON G J.通过集体矩阵分解的关系学习[A].第十四届ACM SIGKDD知识发现与数据挖掘国际会议论文集[C],2008:650-58.

[2]ELKAHKY A.M,SONG Y,HE X.推荐系统中跨域用户建模的多视图深度学习方法[A].第24届国际万维网大会论文集[C],2015:278-288.

[3]JIANG M,CUIP,YUAN N J,et al.少即是多:通过重叠人群来沟通跨平台行为[C].AAAI. 2016:13-19.

[4]CHEN W,HSU W,LEE M L.来自多个领域的建议[A].第19届ACM SIGKDD知识发现和数据挖掘国际会议论文集[C],2013:892-900.

[5]练建勋.基于多样化内容数据的个性化推荐系统[D].合肥:中国科学技术大学,2018.

[6]BERKOVSKY S,KUFLIK T,RICCI F.协同过滤中的跨域中介[A].用户建模国际会议[C], 2007:335-359.

[7]LU Z,ZHONG E,ZHAO L,et al.跨域推荐的选择性迁移学习[A].2013 SIAM数据挖掘国际会议论文集[C],2013:641-649.

[8]LI B,YANG Q,XUE X.电影和书籍可以合作吗?面向稀疏度降低的跨域协同过滤[C].IJCAI,2009(9):2052-2057.

[9]ZHANG F,YUAN J,ZHENG K,et al.利用餐厅的就餐偏好进行餐厅推荐[A].第25届国际万维网大会论文集[C],2016:725-735.

[10]LIAN J,ZHANG F,XIE X,et al.跨领域推荐系统的多面模型[A].国际知识科学、工程和管理会议[C],2017:322-333.

[11]J. Son,S.B.J.E.S.w.A. Kim. 基于内容的多属性网络推荐系统过滤[J].专家系统与应用,2017(89):404-412.

[12]Y.Koren, R. Bell,C.J.C. Volinsky.推荐系统的矩阵分解技术[J].IEEE Computer,2009,42(8):30-37.

[13]Y.Dong,N.V.Chawla,A. Swami.异构网络的可扩展表示学习[A].第23届ACM SIGKDD知识发现和数据挖掘国际会议论文集[C],2017:135-144.

[14]李金.基于內容和图结构信息融合的跨域推荐问题研究[D].济南:山东大学,2020.

编辑 司 楠

猜你喜欢
跨域协同算法
家校社协同育人 共赢美好未来
为群众办实事,崂山区打出“跨域通办”组合拳
融合创新 协同发展
G-SRv6 Policy在跨域端到端组网中的应用
Travellng thg World Full—time for Rree
京津冀协同发展
实现跨域的最佳方案CSST
学习算法的“三种境界”
算法框图的补全
算法初步知识盘点