基于个性化导购的商品智能动态推荐系统

2018-02-08 09:53姚剑
价值工程 2017年35期
关键词:关联规则数据挖掘

姚剑

摘要:为了节省顾客商品选购时间,帮助顾客从海量商品中快速找寻意购物品,本文尝试将关联规则与个性化导购相结合,引入FP-tree关联规则算法,利用商品推荐公式中的关联度,同时综合利用商家利益最大化、热销商品等因素,建立商品推荐综合评分公式。基于综合评分值对待推荐商品进行动态排序,并将排序结果推送给客户,实现个性化商品智能动态推荐服务。

Abstract: In order to save shopping time and to help customers find the favorite goods conveniently from numerous merchandises, this paper attempted to develop an intelligent recommendation system for individual commodity based on association rules. We established the comprehensive score formula of commodity selection by introducing the FP-tree association rules, using the correlation index of the recommended formula and synthesizing some factors such as the maximum of benefits, hot commodity, etc.. The merchandise recommendation service is based on the rank of comprehensive score, the sorted results are finally pushed to the customer.

关键词:个性化商品导购;数据挖掘;关联规则;智能推荐系统

Key words: guiding-purchase of individual commodity;data mining;association rules;intelligent recommendation system

中图分类号:TP311.1 文献标识码:A 文章编号:1006-4311(2017)35-0199-03

0 引言

近年来,随着信息技术的飞速发展。网上购物方式在人们的生活中比重已经越来越大。商品推荐系统主要是基于网站的用户购买记录与浏览行为,通过算法对商品库进行匹配,将当前热门的、用户收藏的或者风格类似的商品推荐给潜在购买顾客[1]。

个性化智能推荐最终目标就是让任何一个访问电商平台的用户,在进入平台页面时,系统能够根据用户日常的行为偏好和习惯,提前知道用户意向购买商品,在还没有发生点击行为时,系统能自动将特定商品推荐到用户访问的页面,提升平台用户下单转化率。即使在用户没有访问平台时,商家通过与用户日常浏览互联网行为轨迹的平台进行联盟合作,在联盟平台推送用户希望购买的商品广告和商品链接,刺激和引导用户点击购买。即使在用户没有打开电脑时,能够通过信息和邮件的方式,根据用户平常的购买频次和周期,在特定的时间推送到用户手机和电脑[2]。

1 工作流程及具体实现

1.1 推薦系统的工作流程

商品动态推荐系统的整个工作流程包括以下四个步骤:商品数据采集、商品数据预处理、商品推荐综合评分、动态智能推荐[3]。

1.2 商品数据预处理

商品数据预处理主要是数据清洗与数据变换,通过数据预处理后得到的商家主推修正系数、商品热销度、商品毛利率修正系数、商品关联度。数据预处理的具体步骤如下:

Step1:商品热销度评分是根据商家最近一段时间(例如1个月内)商品销售记录,汇总后排名经规范化后的计算得分。最高取值为1,最低取值为0。

式(1)中:γ1为商品热销度,取值范围在0-1之间;Qi为商品销售量;Qmax为该商家最近1个月内有销售记录的商品最大销售量;Qmin为该商家最近1个月内有销售记录的商品最小销售量。

Step2:商家主推系数γ2是针对新商品做出排序得分,最高为1,最低为0.1,系数越高表示商户越期望将此商品推荐给顾客。

Step3:商品毛利率修正系数是根据商品单价和成本计算得到毛利率,再经归一化后得到。

式(2)中:γ3为特定商品的毛利率修正系数,ρ单价为商品销售单价,ρ成本为商品采购成本。

Step4:商品关联度修正系数γ4是根据历史订购数据,采用FP关联规则算法得到商品关联度推荐评分值,再经过归一化,反映商品与顾客已采购商品的关联程度。

关联规则是形如X→Y的函数(X项集和Y项集不相交)。本文引入支持度与置信度来衡量关联规则强度。支持度(support)用于确定规则可以对给定数据集的频繁程度;置信度(confidence)用于确定项集Y在包含项集X的事务中出现的频繁程度[4]。

支持度较低的规则,表示发现频率较低,可能是偶然发生。可以通过确定阈值来删除这些支持度较低的规则。本文的商品智能推荐系统采用FP增长算法,根据最小支持度找出频繁项集,再由频繁项集产生满足一定支持度和置信度条件的强关联规则。

1.3 动态推荐系统的具体实现endprint

1.3.1 基于关联规则的推荐算法

经过数据预处理之后,基于关联规则的商品智能推荐算法,可以描述如下:

引进FP-tree算法后,该算法只需要进行两次商品数据库扫描,直接压缩数据库便可形成一个频繁模式树,同时生成相应的关联规则[5]。

算法关键步骤:第一步利用商品数据库构造FP-tree;第2步从FP-tree中挖掘频繁模式。

①构建FP-tree;

②FP增长算法产生频繁项集;

③产生强关联规则。

1.3.2 商品推荐综合评分

本文所述的商品推荐系统是对商品关联系数、商家主推、商品毛利率、商品热销度的综合考量,特定商品推荐综合评分计算公式如下:

S综合评分是特定商品推荐综合评分,取值范围0-40;γ1为特定商品热销度的评分,取值范围0-1,α1为其权值;γ2商家对特定商品的主推修正系数,取值范围0.1-1.0,α2为其权值;γ3是特定商品毛利率修正系数,取值范围0.1-1.0,α3为其权值;γ4是特定商品与已选商品关联度修正系数,取值范围0.1-1.0,α4为其权值。(注:4种评分因素分配的权值不同,则商品推荐综合评分值也会不同)

传统综合评分公式只能对每个指标加权求和得到综合评分,而该新公式在此基础上加入后缀影响因式,可以自行根据指标数值的情况提升重要指标(占权值较大的指标)排序时的优势地位,即权值大的指标值越大,在总体中排序更具优势。但综合评分排序并不完全按照权值排序,还会考虑其他指标。

2 智能推荐系统的应用实例

为验证推荐综合评分算法有效性,将此算法与一般综合评分算法进行验证和比较。

某顾客在某店铺已选购了智能手机,该店铺收集相关商品数据如表1,包含12个商品组和20个商品。

通过扫描表1商品数据集,统计得到每个商品的支持度计数如表2所示。

设最小支持度为2,丢弃非频繁项,得到频繁项,按照支持度递减的排序为:智能手机、平板电脑、智能手环、旅行箱、玩具机器人、自拍杆、路由器、充电宝。

接着按照上述算法构建FP-tree和FP增长算法,产生以智能手机结尾的频繁项集,并将其中归一化后达到最小置信度0.40的具有强关联规则的项集输出:{平板电脑、智能手机}、{智能手环、智能手机}、{旅行箱、智能手机}、{玩具机器人、智能手机}、{自拍杆、智能手机},它们的置信度分别为:0.80,0.70,0.50,0.40,0.40。

整理与智能手机具有强关联规则的5个商品的销售量、单价、成本的数据如表3示。

根据原始数据及式(1)-式(4),计算出热销度评分、毛利率、商家主推度、关联度。现将4种数据变量整理如表4所示。

根据经验设定权值,由传统综合评分公式和本文综合评分公式分别计算得到各商品的综合分数如表5。

对比分析两种方法:由传统方法计算出的智能手环和自拍杆的分数都是6,故当顾客选购了智能手机和行车记录仪,这两类商品处于同等推荐位置,但显然是不合理的,因为智能手环与智能手机和行车记录仪关联度是0.7,远远大于自拍杆与智能手机和行车记录仪的关联度0.4,智能手环应比自拍杆更具有推荐优势位置,且智能手环和自拍杆的分数差为1.184也在合理范围内,不会太悬殊。

自拍杆和玩具机器人的关联度都是0.4,自拍杆热销度0.70,毛利率0.62,主推度0.90,对应玩具机器人热销度0.85,毛利率0.60,主推度0.70,推测它们的推荐地位应该是比较接近的。而自拍杆与玩具机器人的改进式分数只相差0.0335,比它们的一般式分数差0.2250更符合實际。

3 结束语

本文主要设计一种基于关联规则综合评分算法的销售服务智能推荐系统。根据已购商品关联度、商家利益最大化、热销商品等因素,以及因素重要度来创建商品推荐综合公式。基于综合评分对各商品进行推荐排序,排序结果最终以移动方式推送给顾客。商品动态推荐服务,能够帮助顾客快速发现感兴趣的商品;同时有助于商家发现商品间关联关系,并采取措施,同时提高客户满意度与营业利润,从而实现消费者和商家的双赢。

参考文献:

[1]张素智,赵亚楠,杨芮.推荐系统研究[J].湖北民族学院学报(自然科学版),2017(01):1-6.

[2]丁雪.基于数据挖掘的图书智能推荐系统研究[J].情报理论与实践,2010(05):107-110.

[3]任明枢.Web数据挖掘及其在电子商务中的应用[D].山东科技大学,2004.

[4]胡迎松,韩苹,陈中新.一个基于Agent的个性化推荐系统[J].计算机应用研究,2006(04):78-80.

[5]李煊,汪晓岩,庄镇泉.基于关联规则挖掘的个性化智能推荐服务[J].计算机工程与应用,2002(11):200-204,229.endprint

猜你喜欢
关联规则数据挖掘
基于并行计算的大数据挖掘在电网中的应用
一种基于Hadoop的大数据挖掘云服务及应用
数据挖掘的分析与探索
基于GPGPU的离散数据挖掘研究