个性化推荐系统概述

2019-03-26 10:23
福建质量管理 2019年17期
关键词:个性化建模协同

(北京印刷学院 北京 102600)

一、概述

1.研究背景

当前社会是一个信息过载(information overload)的社会,为了解决这种问题,人们发明了搜索引擎。虽然搜索引擎可以有效帮助用户获取其需要的信息,但它也有局限性,在大多数场合,用户并不明确自己需要的信息,搜索引擎也就不能发挥其最大的作用。

推荐系统,就是为了填补搜索引擎的缺陷而产生的。它以用户的历史行为为基础,将用户的喜好和兴趣分析透彻,主动地将用户感兴趣的结果反馈给用户,而不需要用户主动描述自己所需要的信息。

2.国内外研究现状

1992年,Goldberg第一次引入了协同过滤的思想,1997年Resnick首次在文献中正式提出了推荐系统这个词汇,他定义了推荐系统是“利用电子商务网站向客户提供商品信息和建议,帮助用户决定应该购买什么产品,仿照销售人员向客户推荐商品帮助他们完成购买过程。”这一定义也被沿用至今。

二、推荐系统及相关算法

1.推荐系统概述

推荐系统是存在于内容平台网站中,网站通过系统向用户推荐商品信息,帮助用户决定应该选择什么,或向他们推荐他们可能会需要的产品,来帮助用户完成购买行为。

为了解决信息过载而造成的时间浪费,个性化推荐系统此而产生。该系统是设立在基于大量数据基础上的一个高级商务智能平台,帮助电商网站向用户提供个性化的解决方案和信息服务。

推荐系统有三个重要模块:用户建模、推荐对象建模和推荐算法建模。首先根据用户的历史行为或信息进行建模,然后将需要推荐的特征对象与用户特征进行匹配,通过某些特定的算法进行计算,将用户可能会感兴趣的商品推荐给用户。

2.相关算法

在构成推荐系统的三个主要模块中,推荐算法是最关键的。判断一个推荐系统是否准确有效,取决于其是否选用了一个好的推荐算法。

(1)基于内容的推荐(Content-based Recommendation)

基于内容的推荐,简而言之,是基于用户以往浏览或购买过的商品的特征,并建立起用户的个人兴趣模型,它将用户的个人兴趣与物品特征来进行匹配,以推荐用户可能感兴趣的商品。它通常是对项目本身的内容属性进行分析。基于内容推荐一般应用于基于文本的内容推荐,如书籍、网页、新闻等,这些物品通常采用非结构化数据来描述。为了描述这些特征,通常采用特征提取技术从非结构化的文本中提取关键特征并建立特征向量。

(2)协同过滤推荐

协同过滤推荐算法主要是利用用户历史信息来为用户进行建模,根据建模作出推荐的一种算法。根据不同的实现方法,可以分为基于记忆的协同过滤和基于模型的协同过滤。该算法是推荐系统中最成功也是被应用最广泛的算法之一。它是利用记录用户各自不同的历史行为来计算用户与用户之间的距离,根据与被评估用户的最近邻居用户对某件商品的评价值来判断被评估用户对某件商品的喜好程度,根据目标用户的偏好程度来为他们进行推荐。

(3)基于关联规则推荐(Association Rule-based Recommendation)

该算法是以关联规则为基础,规则头是已购商品,推荐对象视为规则体。关联规则挖掘可以发现销售过程中各种不同商品的相关性。

(4)基于效用推荐(Utility-based Recommendation)

该算法是基于用户使用项目的效用情况上计算的,其核心问题是创建一个覆盖全用户的效用函数。因此,用户数据模型是什么样的,大部分要取决于系统使用什么样的效用函数。该算法的优点是它可以考虑非产品的性质,如供应商的可靠性和产品的可用性。

(5)基于知识推荐(Knowledge-based Recommendation)

该算法并不需要用户偏好和需要的数据来支持,更像是一种推理技术。效用知识(Functional Knowledge)是一种为了满足某类特定用户而需求的某种项目的知识,它可以解释用户需求和系统推荐之间的关系。

(6)组合推荐

由于上述所有算法都有缺陷,所以在日常工作中最常用的是组合推荐(Hybrid Recommendation),根据某一问题的实际情况将多种推荐算法组合在一起使用,可以通过组合后弥补或避免其中单个推荐系统的缺点,提高推荐系统的性能。

三、各大电商平台推荐系统概述

1.亚马逊

著名的电商网站亚马逊是个性化推荐系统的顶级应用者和推广者,被RWW(读写网)称为“推荐系统之王”。其最主要的是个性化商品推荐列表和相关商品的推荐列表。它采用协同过滤技术,可以准确分析每个用户购买的情况,主动向用户推荐,并根据用户的历史行为,给出某个用户可能喜欢的书籍或商品供其选择。据美国著名的科技博客网站Venture Beat统计,亚马逊有约35%的销售额来自于其推荐系统。

2.今日头条

今日头条的推荐系统实际上是建立一个三维变量函数,其所描述的内容是用户对内容的满意度。这三个维度分别是内容、用户特征、环境特征。将这三个维度结合起来,系统能够得出一个计算结果,用来预测推荐内容在某一场景下是否会得到用户的喜欢。

四、评价指标

1.用户满意度(Customer Satisfaction)

在电子商务平台中,用户满意度主要是通过统计用户的行为来得到,如果用户购买了系统为他们推荐的商品,就说明用户对推荐结果是满意的。此外,用户的满意度还可以通过点击率、转化率、停留时间等指标来衡量。

2.预测准确度(Prediction Accuracy)

预测准确度是评判一个系统是否能够预测用户行为的能力,它的主要思想是将推荐算法计算出的推荐结果与用户对某一商品的真实喜爱程度进行相似度匹配。该指标可以通过离线计算得出。

3.覆盖率(Coverage Rate)

覆盖率是用来描述一个推荐系统能否挖掘出这个内容平台网站更多长尾物品的能力。其定义为推荐系统能够向用户推荐出的物品占平台中总物品的比例。

五、总结

网络技术的飞速发展给人类生活带来了极大的影响,提供了许多便利,但随之而来的信息过载问题也不容小觑。在有限的时间和资源中,用户并不希望在浩如烟海的信息中漫无目的地寻找自己所需要的信息,更希望能够简便高效的找到他们所需要的信息。

推荐系统的本质就是猜测用户的喜好,并向其推荐,从而帮助他们购买。而当人们的喜好不断发生变化时,推荐系统如何准确及时地抓住这些变化并满足人们实时的需求,成了现在个性化推荐系统急需解决的一大问题。

猜你喜欢
个性化建模协同
家校社协同育人 共赢美好未来
蜀道难:车与路的协同进化
联想等效,拓展建模——以“带电小球在等效场中做圆周运动”为例
坚持个性化的写作
“四化”协同才有出路
基于PSS/E的风电场建模与动态分析
新闻的个性化写作
不对称半桥变换器的建模与仿真
上汽大通:C2B个性化定制未来
三医联动 协同创新