蔬菜销售电子商务平台的推荐系统研究

2014-02-20 06:00赵志超
计算机与网络 2014年13期
关键词:网页蔬菜销售

赵志超

(河北中信联信息技术有限公司河北 石家庄 050091)

蔬菜销售电子商务平台的推荐系统研究

赵志超

(河北中信联信息技术有限公司河北 石家庄 050091)

应用中的区域蔬菜电子商务系统大多具备网上购销的主要功能,但在提高销售量和消费者应用体验方面有重要作用的推荐系统则建设不多,或不够完善。从用户管理和交易行为特点数据中提取用户特征和购销行为模型,生成k—均值聚类簇和簇中心,计算新用户相应信息与聚类簇中的最近邻居集数据的最大相似度,生成销售推荐信息,可构建出适合区域蔬菜电子商务网站用户规模和应用的推荐系统。

蔬菜销售电子商务聚类簇协同过滤算法推荐系统

1 引言

区域性蔬菜产销电子商务系统可实现定域内蔬菜产业重点县的专业合作社与超市、消费者的直接对接,为蔬菜合作社、蔬菜生产企业(单位)、农资供应单位、物流配送企业、超市和蔬菜消费者提供信息发布、浏览和交易等功能。用户通过蔬菜和农资产品展示、信息发布、撮合洽谈及物流配送等功能,实现供需双方“键对键”的网上交易,包括蔬菜、农资的网上销售、电子支付、物流配送管理以及客户关系管理等功能[1,2]。

这些建设中的蔬菜电子商务系统虽然具备了网上购销的主要功能,但仍有借鉴学习大规模电子商务网站先进营销技术和丰富完善自有特点功能的发展空间。蔬菜和农产品销售时间因素很重要,利用信息技术提高交易效率是解决此类问题的有效手段。

结合农产品销售和消费者的活动特点,综合用户信息和购销行为数据,经过聚类分析和协同过滤等算法,为网上销售对时令节气依赖很强的蔬菜和农产品创新设计推荐系统,有助于缩短销售供需周期,提高销售量,降低购销成本,优化销售体验。

2 区域性蔬菜电子商务平台与用户数据

区域性蔬菜产销电子商务系统通的基本系统功能结构如

图1所示,主要由系统管理、合作社管理、会员管理、后台运营管理、推荐系统、第三方支付管理、交易管理和商品管理等多个功能相对集中,数据相互共享的子系统组成[3]。

推荐系统在传统农产品销售的电子商务网站上应用较少,但对时令节气依赖很强的蔬菜和农产品上网销售来说,个性化推荐系统能大大提高网站销售额,有效缩短供需销售周期,优化销售体验,值得投资建设。

协同过滤算法推荐系统的基本思想是兴趣和需求相近的消费者可能对同样的商品感兴趣,并可能产生相同的采购行为。因此,推荐系统的运行离不开积累用户的历史交易数据。为了结合行业和地域特点,并有效地管理和应用用户数据,蔬菜电子商务网站以会员机制运作。蔬菜合作社、蔬菜生产企业、农资供应企业、蔬菜加工企业、蔬菜销售企业(超市、批发市场)、普通消费者或其他组织和个人等,经网上注册和审核后,均可成为交易级会员。

可供蔬菜电子商务交易推荐系统利用的用户信息和行为数据主要有以下3类。

①用户档案:用户会员的基本信息,如会员级别和会员分类;注册的基本信息,如组织的名称、法人、单位属性、经营范围、注册资金和地域、经营规模和财务状况等,个人的姓名、性别、年龄、职业、地域、收入及教育背景等资料;

②用户交易记录:用户在电子商务网站上购买商品的信息,会员积分信息等;

③用户行为特征:用户对商品的评分信息、浏览行为、需求信息和反馈信息等。

这些数据只有部分是用户会员登录注册提供的,大部分是用户在网上浏览、交易过程中,依靠电子商务网站收集整理的。

3 用户交易行为数据记录

目前许多协同过滤推荐算法使用用户对商品的评分数据作为推荐基础,用户评分数据分为显式评分和隐式评分2类。蔬菜电子商务系统采用显式评分和隐式评分相结合的方式,对于只能通过显式记录才能获得有效的记分或便于显式记分的记录项采用显式评分,其他则应用隐式评分,以便提高用户购买体验。

协同过滤推荐系统通过对系统可以捕获的操作进行分析以获取隐式评分,这些操作称为隐含兴趣指示操作。隐含兴趣指示操作主要有:

①标记网页操作:包括将网页添加到收藏夹、从收藏夹删除网页、将网页另存为本地文件、打印网页、以及将网页以电子邮件方式发送给好友等;

②编辑网页操作:包括剪切、复制和粘贴等编辑操作,还包括在新窗口中打开链接,在网页中搜索文本和下拉滚动条等操作;

③重复行为:如果用户在某个网页上重复某些操作行为,可能暗示用户对该网页有更多兴趣。如某网页的打开时间比较长,反复上下左右拉动滚动条,重复访问某一网页等行为。

4 推荐数据算法分析

为了避免用户数据库体积庞大影响算法效率,系统设计首先对历史数据进行k—均值聚类,预先分成k个不同的簇,而且每个簇的中心采用簇中所含记录的均值计算而成,通过机器学习算法聚成用户兴趣特征类簇,然后再用类中心与新用户的行为数据进行相似分析,快速归类后,再与类中的元素进行最大相似分析,做出推荐建议。

有了用户行为数据,就可以进行推荐分析。为此,可以建立下面的数学模型。

设有具有n个用户的p个商务行为的观测样本数据xi= (xi1,xi2,…,xip)T,i=1,2,…,n

这样,每个行为可视为p元空间的一个点,n个行为序列组成p元空间的n个行为向量。任意2个向量xi,xj的欧氏距离定义为

图1 蔬菜销售电子商务平台总体结构设计

根据观测样本数据空间的规模,选择适当的D=dij将所有用户聚类分成k个兴趣特征用户数目不等的,互不相交的类簇集N={N 1,N 2…Nk},其中心可表示为yi=(yi1,yi2,…,yip) T,i=1,2,…,k,k

5 推荐产生

通过上面的相似性度量方法可以得到目标用户的最近邻居(聚类集),衡量用户u与最邻近用户行为簇Nu中所有用户行为向量之间的相似性程度,常用向量的相关系数和夹角余弦来描述。任意两向量xi,xj的夹角余弦cos(xi,xj)为:

cos(xi,xj)的绝对值越接近于1,说明向量xi和xj之间的夹角越小,相互关联性越大。

用户u对某商品项i的预测评分Pu,i可以通过用户u从最近邻居行为数据簇集合Nu={U 1,U 2,…,Us}中邻居对该项的评分获到:

式中,cos(u,uh)表示用户u与其最近邻居簇中用户uh之间的相似性,uhi表示用户uh对项目i的评分。和分别表示用户u和用户uh对行为项的平均记分。

上述方法可以预测用户对所有未评分项的评分,然后选择预测评分最高的前若干个项作为推荐结果反馈给当前用户u。当使用交易数据作为算法输入时,则可以采用如下2种方式产生top—N推荐:

①最频项推荐:扫描当前用户每一个最近邻居的购买记录,对其购买的商品进行计数,选择出现频率最高且当前用户没有购买过的前N件商品作为推荐结果;

②关联推荐:将当前用户最近邻居的交易数据作为一个虚拟的交易数据库,进行关联重合挖掘。如果在关联用户重合部的商品已出现在当前用户的购买商品集合中,就向当前用户推荐在预测关联部分中用户尚未购买的商品[5]。

6 推荐系统主体结构设计

根据上述思想设计的电子商务推荐系统由3个主要部分构成,如下图2所示。

图2 推荐系统主体结构示意图

①用户行为记录:收集和记录用户行为和反馈数据;

②推荐引擎:分析用户行为数据,按照模型生成推荐结果并展示在用户界面上;

③页面展现:展示推荐结果,收集用户对推荐结果的反馈。

用户行为记录系统是推荐系统的基础,首先需要实时更新用户的行为数据,同时还需要能够对大数据量的快速存储和处理。没有大量翔实的数据记录,推荐引擎的工作成果就会大打折扣。推荐引擎的设计与推荐算法策略,则决定着整个系统的效率。推荐系统的人机交互界面设计有非常重要的作用,好的交互界面设计不仅能良好地展现推荐商品的信息,更能够收集到更多,更准确的用户反馈,对提高推荐引擎的推荐的准确性和系统的性能改善都有重要作用[6]。

7 结束语

因为销售行为是持续的过程,推荐系统必然也是一个持续收集用户行为,更新用户兴趣模型,调整用户推荐算法和策略的闭环信息交互系统,尤其是评价推荐转化成销售的效果更重要。消费者的行为不是一成不变的,推荐系统能够随之调整推荐模型和策略,提高推荐准确有效率,是需要持续深入研究的课题,但随着用户行为数据积累的不断增多和方法的改进,系统的推荐结果将会越来越准确越有效。

虽然讨论的是区域蔬菜电子商务平台上推荐系统的设计应用,由于互联网的覆盖特性,可以方便地扩展到全国乃至更广的区域,但是,系统的组织,流程和数据管理,乃至推荐算法将需要根据用户群和地域特性进行相应的调整。

[1]邓爱林.电子商务推荐系统关键技术研究[D].上海:复旦大

学,2003.

[2]青海.电子商务推荐系统核心技术研究[D].北京:工业大学,2009.

[3]PETER H.机器学习实战[M].李锐,李鹏,译.北京:人民邮电出版社,2013.

[4]范金城,等.数据分析[M].北京:科学出版社,2002.

[5]MARMAN ISH,BABENKO D.智能web算法[M].阿稳,陈钢,译.北京:电子工业出版社,2011.

[6]秦寿康,等.综合评价原理与应用[M].北京:电子工业出版社, 2003.

Research on Recomm endation System Based on Vegetable Sales E-comm erce Platform

ZHAO Zhi-chao
(HebeiUniW in Information Technology Co.,Ltd.,Shijiazhuang Hebei050091,China)

The local vegetable E-commerce systemsmostly have themain function of Internetmarketing,but the construction of recommendation systemswhich plays the important rolesin the aspectsof improvementof salesand consumer application experiencesare notmany or inadequate.This paper extracts the user characteristics and buying/selling behaviormodel from the usermanagement and trading behavior characteristic data to build the k-means cluster and cluster center,and calculates themaximum sim ilarity of the nearest neighbor setdata in the relevant information ofnew usersand clustersto generate the salesrecommendation information,in order to build the recommendation systemswhich are suitable for localvegetable E-commercewebsite user scale and application.

vegetablessales;E-commerce;cluster;collaborative filtering algorithm;recommendation system

TP393

A

1008-1739(2014)13-62-4

定稿日期:2014-06-12

猜你喜欢
网页蔬菜销售
奇怪的蔬菜
蔬菜
这四个字决定销售成败
基于CSS的网页导航栏的设计
基于HTML5静态网页设计
给人带来快乐的袜子,一年销售1亿美金
基于URL和网页类型的网页信息采集研究
网页制作在英语教学中的应用
蔬菜也“疯狂”
销售数字