数据挖掘在物流企业客户关系管理中的研究

2018-03-29 07:14杨慧慧梁艳苏辉辉
商情 2018年10期
关键词:关联分析客户关系管理

杨慧慧 梁艳 苏辉辉

[摘要]本文根据该公司数据库中的客户信息,利用数据挖掘中的Apfiofi算法对客户购买服务进行关联性分析,发现企业客户的购买行为。进而帮助企业将自身的服务业务对客户进行相关的推荐或者对一些关联性服务业务进行精准营销,提高公司的销售业绩,挖掘潜在客户群。

[关键词]关联分析 spass clementine 客户关系管理

客户就上帝,客户是企业盈利的源泉,在目前这个大数据时代,企业如何更好的管理客戶数据信息,如何更好地保持老客户、不断开发新客户更成为其成功的关键所在。

越来越多的企业注意到客户信息的管理与挖掘,并且大部分的企业管理者,已经投入了不小的人力以及资金用于客户信息的管理与客户购买行为的建设与实施。很多企业项目实施也并未得到很好的预期效果。因此,本文将利用数据挖掘关联规则中的Apriori算法,以该公司数据库中的客户信息为基础,挖掘出客户购买行为的关联性,找出内在的规律,从而帮助企业更好的了解客户,开发客户价值,进而更好的进行客户服务,提高企业收益。

一、Clemntine简介

Spass clementine软件是在1999年被ISL公司收购后将clementine产品重新进行整合和开发,用来进行数据挖掘的软件产品。该软件作为一个开放式的数据工具,它主要是应用了多种图形接口分析技术,通过节点的链接来完成整个数据挖掘过程,使得整个过程变得直观明了。

spass clementine具有对数据进行预处理和转换的强大功能,使用该软件时对使用者的要求简单,使用者不需要会大量的编程语言,并且该挖掘软件提供了大量的数据挖掘模型,例如分类模型,决策树模型等,以及灵活的算法例如神经网络算法,多元回归算法等,所以在应用的过程中受到了用户的喜爱和追捧。

本文基于数据挖掘软件spass clementine平台,利用数据挖掘算法中的Apriori算法,对某货代公司购买服务的客户信息进行分析,从大量的客户信息中发现有价值的规则和模式,进而为物流企业管理者在客户关系管理及营销决策中提供理论依据。

二、基本原理

(一)关联规则

R.Agrawal等人于1993年首先提出了挖掘顾客交易数据库中项集间的关联规则问题,对于该公司数据库中的客户信息挖掘的目的是找出客户购买行为的关联关系。

设I={i1,i2,i3,L,im}是由m个不同的项组成的,给定一个事务数据集D,则事务数据集D={t1,t2,t3,L,tk,L,tn},其中tk={k=1,2,3,L,n}称之为事务,事务数据集D中的每一个事务tk是I中一组项目的集合,设A与B是I的子集:

若Support(A)不小于用户给定的最小支持度min sup,则称A频繁项集;反之,称A为非频繁项集。

一条关联规则形如A→B的蕴含式,其中A与B为项集,且AIB=?与,项集A∪B的支持度称为关联规则A→B的支持度,则Support(A∪B)Support(A→B)。

关联规则A→B的置信度:

从上述可得出,关联规则A→B成立的条件:①如果关联规则的支持度为s,则事务数据集D中至少有集s%有的事务包含A∪B;②如果关联规则的置信度为C,则事务数据集D中包含的事务数至少有c%也同时包含B。

关联规则挖掘问题中就是在事务数据集D中找出具有用户给定的最小支持度min sup和最小置信度min conf的关联关系。若Support(A→B)≥min sup且confidence(A→B)≥min conf,则关联规则A→B是强关联规则。所以关联规则挖掘问题可以分为以下2个子问题。

(1)根据最小支持度找出数据集D中的所有频繁项集。

(2)根据频繁项集和最小置信度产生关联规则。

(二)Apriori算法

Apriori算法的核心问题是频繁项集的取得,首先由事务数据库和给定的支持度阈值得到所有的频繁项集,所有支持度不小于支持度阈值的项集称为频繁项集。然后由频繁项集产生满足置信度要求的关联规则。

(1)遍历计算每个项集的支持度,找出支持度大于或等于最小支持度阈值min sup的项集,丢弃小于最小支持度阈值min sup的项集,第一次扫描得出频繁项集L1

(2)利用第一次扫描出的频繁项集L1,进行自然连接产生新的候选集C1,并利用(1)步的方法,找出满足最小支持度的频繁项集L2,同理,第k(k>1)次扫描前先利用第k-1次的扫描结果(即频繁项集Lk-1),以此类推,重复上述过程,直到没有频繁项集产生为止。

三、数据挖掘中的关联算法在货代企业中的实证分析

某国际货运代理有限公司自该公司自成立以来,与海关,检验检疫,船代,港区及相关行业保持持久密切的联系,和多家的船公司,国际性货货运代理机构建立了长期互为代理关系。该公司在同行业中名列前茅。该公司的主要服务内容有承办各种海运、空运进出口货物的国际运输代理业务。具体包括:各船公司货运订舱业务;世界各地拼箱、拆箱业务;代理报关、报检、保险业务,以及中转、仓储、运输服务。本文从该公司中获取了30590位客户信息,客户属性包括企业性质,企业ID号,购买的服务,其中包括,报关,清关,换单,国内运输,仓储,包装,保险拼箱等业务。

(1)数据预处理。数据预处理是指在对数据进行数据挖掘分析之前对原始数据进行的清洗,集约,转换等一系列的处理工作,通过对这些数据的处理,能够使数据集达到数据挖掘算法进行分析所要求的规范和标准。由于从公司获取的数据不符合数据挖掘的标准格式,因此首先对数据进行处理,处理后的数据格式满足了做关联分析对格式的要求,数据预处理流程如下图1所示:

猜你喜欢
关联分析客户关系管理
玉米骨干亲本及其衍生系中基因的序列变异及与株高等性状的关联分析
玉米骨干亲本及其衍生系中基因的序列变异及与株高等性状的关联分析
基于随机函数Petri网的系统动力学关联分析模型
关联分析技术在学生成绩分析中的应用
私募基金对高净值客户的客户关系管理
中小企业客户关系管理实施策略探讨
基于关联分析的学生活动参与度与高校社团管理实证研究
万科集团住宅产品客户关系管理探析
不同的数据挖掘方法分类对比研究