基于SOM神经网络的移动客户细分研究*

2015-07-24 19:01胡桂莉黄秋婵
网络安全与数据管理 2015年23期
关键词:细分权值类别

胡桂莉,喻 昕,黄秋婵

(广西大学 计算机与电子信息学院,广西 南宁 530004)

基于SOM神经网络的移动客户细分研究*

胡桂莉,喻 昕,黄秋婵

(广西大学 计算机与电子信息学院,广西 南宁 530004)

利用基于RFM模型的自组织特征映射神经网络 (Self-Organizing Feature Map,SOM)对移动客户进行细分,可以有效地解决各类别特征不明显、特征参数相互交错、非线性分布的类型识别问题。研究过程中将客户的属性划分为近度、频度、值度三个指标,模拟专家分类的功能,根据各个客户簇的特征进一步分析客户的终身价值,量化分析客户的重要性。最后利用相关的市场营销知识对各个客户类别提出相应的营销策略方案。

SOM神经网络;RFM模型;移动通信;客户细分;营销策略

0 引言

客户细分 (Customer Segmentation)是指将一个大的客户群体划分成一个个细分群的动作[1]。常用的客户分类算法主要有K-means聚类算法、决策树算法、BP神经网络算法、粒子群优化(PSO)算法和自组织特征映射神经网络(SOM)算法。本文采用基于RFM模型的SOM神经网络对移动客户进行细分。自组织特征映射神经网络(Self-Organizing Feature Maps,SOM)是由芬兰赫尔辛基大学神经网络专家Kohonen教授在1981年提出的。Kohonen认为[2],当神经网络接受外界输入模式时将会分为不同的区域,各区域对输入模式有自动完成不同的响应特征,即无导师的学习并自动聚类。吴春旭等[3]曾利用SOM神经网络对电信客户进行细分并证明分类的有效性。林盛等[4]曾利用 RFM的模型对客户进行细分,并使用 K-均值聚类法,但 K值需要事先给定,而 K值的选定非常难以估计。本文之所以选择SOM神经网络对移动客户进行细分,主要有三个方面的原因,一是它的性能比较好,可以处理大量的数据集;二是它对孤立点不敏感[5];三是它可以自动地进行权值的调整,同时通过优化学习率,使其快速收敛。

近年来,关于 SOM神经网络的应用研究很广泛。杨于峰等[6]利用 SOM神经网络对品牌丑闻在微博上的传播进行分类预测。他们直接将RFM模型进行细化,利用客户的动态变化属性进行聚类。张静[7]在基于SOM的变压器故障诊断研究中,与DGA方法进行比较,结果表明前者的分类结果准确且快速。孙进进和王苗苗[8]将 SOM神经网络对民用机场进行分类,更好地分析各个机场的特性。张吉刚等[9]利用 SOM神经网络对高校教师职称进行评审,使得评价结果更加客观和准确。由此可知,根据研究对象的特殊性,可以建立RFM模型进行聚类,也可以直接对RFM指标进行具体化后再聚类,其结果都证明了SOM神经网络聚类结果的准确性和客观性。

1 移动通信行业客户RFM商业模型

客户分类的常用方法有基于指标组合和基于顾客利润率的客户分类方法[10]。Arthur Hughes研究指出客户数据库中的RFM是数据分析的最好指标,而RFM的细分依据又是客户的消费行为。因此,本文选用RFM指标模型对移动客户进行细分。RFM模型[11]中的三个常用指标分别为:近度(Recency)、频度(Frequency)、值度(Monentary)。传统的RFM模式中,近度指最近一次购买到现在的时间间隔。频度指一定时间内的购买频率。值度指购买的金额。针对移动通信行业的特殊性,本文改用客户在六个月内的缴费情况来代替客户的消费行为。客户的RFM指标分别是最近一次缴费距离调查日的时间间隔、缴费的次数以及缴费的总额。这样选取代替指标的理由是:首先,缴费时间间隔一般比较大,用它代替消费近度,可以避免消费近度难以区别的问题;其次,消费频度高但是缴费次数不是很多,用缴费次数代替消费的频度可以减少对消费频度统计的工作量;最后,客户的消费总额等于缴费总额。以下是本文采用的 RFM指标与传统RFM指标的对比,如表1所示。

表1 传统的RFM模型与移动业RFM模型的对比表

2 SOM建模

2.1 网络模型

芬兰学者 T.Kohonen于1981年提出了SOM神经网络[2],并给出SOM神经网络的基本结构模型。如图1。

图1 SOM神经网络的组织结构图

由图1可以看到,SOM神经网络是由输入层和输出层构成。输入层的神经元个数为 n,由输入向量的维数决定。输出层的神经元个数为m,一般按照二维点阵进行排列。其中,输入层和输出层的神经元之间通过权值进行全连接,且输出层的神经元之间也相互通过权值连接。

2.2 SOM神经网络的算法流程

SOM神经网络的学习主要分为如下8个步骤:

(1)初始化[12]。 首先,将[0,1]区间内的随机值赋给神经网络的连接权 {ωij}, 令i=1,2,3, …,N,j=1,2,3,…,M;其次,确定学习率 η(t)的初始值 η(0)(0<η(0)<1);最后以获胜神经元 C为中心确定学习领域 Nc(t),该区域一般是正方形或圆形区域[12],如图2所示。Nc(t)为第t次学习过程中该领域所包含的神经元个数,设达到最优结果时总的学习次数为 T。

图2 被选神经元及其领域变化

(3)预处理神经元之间的连接权值 Wj=(ωj1,ωj2,ωj3,…,ωjN),分别计算它们与输入对应向量之间的欧式距离djk,把其中与距离最小的神经元C作为获胜神经元。

(4)自动更新神经元 C的学习半径,调整输出节点的连接权值向量,权值调整如下:

3 案例分析

(5)调整完成后输入训练集合中下一个神经网络的矢量 Xp+1。

(6)令 t=t+1,更新学习率并选取另一组训练数据输入神经网络进行训练,返回步骤(3)继续循环操作。

(7)当 t=T时,结束训练算法。

(8)输入测试样本,如果预测结果输出与期望结果基本一致,则网络训练成功并结束训练,否则重新调整网络的学习参数并继续训练。

最后,SOM神经网络的输出如下:

3.1 Kohonen网络的构建

本文采用 Kohonen网络模型:输入层节点数 Inum= 3,即输入向量为三维;竞争层呈二维方阵排列,总节点数 K=36;输出层的节点数 g=6,即客户类别数。初始化输入层的学习率为 rate1min=0.01,rate1max=0.1;初始化输出层学习率 rate2min=0.5,rate2max=1;初始化学习半径r1min=0.4,r1max=0.5。输入层神经元与竞争层神经元之间的连接权值 ω1=rand(Inum,k),竞争层各个神经元与输出节点神经元之间的连接权值 ω2=(K,g),迭代次数 maxgen=10 000。计算最优节点 [mindist,index]=min(dist(x,ω1))。

3.2 基于RFM模型客户分类思想

基于 RFM模型的客户细分指导思想主要包括了以下六个步骤:

(1)根据专家分析结果确定 RFM 的权值[4],[ωR,ωF,ωM]=[0.221,0.341,0.439];

(2)根据客户的 RFM权值进行加权和划分,并利用SOM的自动聚类功能得到多个客户簇;

(3)分别计算全部客户的总 RFM平均值和各个客户簇的RFM平均值;

(4)把各个客户簇的 RFM 平均值与全部客户的RFM总平均值相比较,比较结果为小于或大于 (等于)总平均值,从而确定各个客户簇的RFM的变动情况(大于(等于)的用“↑”表示,小于的用“↓”表示);

(5)借鉴现有的客户分类方法,根据每个客户簇的RFM变动情况分析该类客户的类型;

(6)将确定好客户类型的客户数据分为训练数据和预测数据两部分,最后使用已经训练好的神经网络对未知客户进行分类。

3.3 样本客户的分类结果

根据研究需要收集了广西大学的 3 200名移动用户最近 6个月的消费情况,将采集的数据进行预处理后,利用 RFM各指标划分客户类别,接着将每类客户的RFM各指标的平均值与总RFM平均值作比较,通过对比得到每类客户 RFM的变动情况并确定客户的类型。将事先模拟专家分好类别的 3 000份客户数据作为训练样本,另外 200个作为预测样本。表2是训练样本客户的分类结果。

表2 样本客户类别

3.4 网络模型的测试和分类

3.4.1 测试

确定创建网络模型的结构后,利用MATLAB工具箱中的 new函数建立一个 SOM神经网络;将准备好的样本输入到网络中,利用 train函数对网络进行训练,用仿真函数sim对网络进行预测输出仿真。利用事先模拟专家分好类别的 200个测试数据进行网络测试,图3和图4分别为 SOM网络模型对 200个预测样本数据进行分类的结果图和误差分析图。

图3 预测样本的输出结果

图4 预测样本的分类误差分析

图3中,黑色小圆圈表示网络预测客户类别,黑色小星点表示模拟专家得到的客户类别。当黑色小圆圈与黑色小星点重合时,表明网络预测输出的结果与实际结果相一致;反之亦然。由图可知,该SOM神经网络对客户细分模型的预测输出是有效的。

3.4.2 对随机输入的未知客户数据进行分类

确定该SOM神经网络已训练好之后,把 2 000个未知类别的客户数据投到该神经网络模型中分类,最终确定客户的类别。如表3所示。

表3 客户类别分析表

表3是该 SOM神经网络对 2 000个未知客户进行分类的结果,共分为五种客户类型,但该分类结果还无法确定各类客户之间的价值和重要性的差别。比如,对于客户簇 5、6,都是重要保持类客户。这就需要分析各类客户的终身价值[13],并根据其大小进行排序,以此作为客户重要性分析的参考。顾客的终身价值运算公式为:

其中,CIk是第 k类客户的 RFM各指标加权后的总得分,wR、wF、wM分别表示 R、F、M 指标的权值,CRk、CFk、CMk分别表示第 k类客户的 R、F、M各指标标准化后的平均值。RFM各指标的标准化运算公式为:

其中,RL和RS分别表示指标 R的最大和最小值,F和M的表示相类似。

最后,根据加权总分的大小对各类客户进行排序,总分越大则表明客户的终身价值越高,忠诚度也越高,客户相对更重要。表4为客户类别终身价值排序结果。

表4 客户类别终身价值排序

由表4可知,客户簇 6的排名第一,故客户簇 6是企业最具价值的客户;而客户簇 1的排名最后,其价值最低。客户簇 1为重要发展客户,但因其价值无法立即显现,因而企业不应将有限的资源过多地投到它身上。客户簇 2的近度高,但是值度很小,属于忠诚度很低的客户,所以企业应该让其自然发展。客户簇3的终身价值排在第四,它们的近度提高了,同时值度也跟着提高,说明这类客户对企业的信赖和忠诚在慢慢地提高,企业可以适当地对其推销一些服务套餐。客户簇 4的近度和频度都在减小,但是其值度增加,同时它的终身价值排名居中,因此属于忠诚度很高的客户,企业应该重点挽留。对于同一类别的客户簇5和6,从表4可看出,在客户价值上客户簇 6大于客户簇 5。企业应该主动与这类客户进行回访,尤其是了解客户簇 6的需求,提高该类客户的忠诚度及消费金额,为企业带来更大的利润。

4 总结与展望

本文利用移动客户的 RFM指标对其进行细分,并分析各个客户簇的特征,在原有的分类基础上进一步计算客户的终身价值指标,并对每一类客户的重要性进行排序,根据其重要性排序得到了六类客户,并对这六类客户分别提出了一些针对性的营销建议,企业可以根据客户的重要程度以及客户的类型实施个性化的服务和营销。

但是,本文的研究还有很多需要改进的地方。比如,其中权值的调整只考虑了学习率及输入模式与获胜神经元及其邻域,却忽略了输入模式分量与全体参与竞争的神经元权值向量间的某种相关关系。因此,本文的后续工作是在原有的基础上改进和完善更适用于移动网络客户分类的神经网络算法,使细分结果更加有效、准确。

[1]科特勒.市场营销管理(上)[M].北京:中国人民大学出版社,1996.

[2]KOHONEN T.Self-organized formation of topologically correct feature maps[J].Biological Cybernetics,1982,43(1):59-69.

[3]吴春旭,鲍满园,苟清龙.自组织映射聚类算法在电信客户细分中的应用[J].计算机应用,2010,19(8):168-172.

[4]林盛,肖旭.基于RFM的电信客户市场细分方法[J].哈尔滨工业大学学报,2006,38(5):759-760.

[5]吕昱,程代杰.基于SOM的市场细分研究[J].计算机科学,2005,32(12):98-100.

[6]杨于峰,余伟萍,田盼.基于 SOM神经网络的品牌丑闻微博传播分类预测研究 [J].情报杂志,2013,32(10):24-28.

[7]张静.基于SOM的变压器故障诊断研究[J].电力学报,2014,29(4):319-321.

[8]孙进进,王苗苗.基于 SOM神经网络的民用机场分类方法[J].交通科技与经济,2013,15(5):83-84.

[9]张吉刚,梁娜.SOM网络在高校教师职称评审中的应用[J].计算机与数字工程,2013,41(2):322-323.

[10]陈伯成.自组织映射神经网络在客户分类中的一种应用[J].系统工程理论与实践,2004,24(3):9-14.

[11]CHEN Y L,KUO M H,WU S Y,et al.Discovering recency,frequency,and monetary(RFM)sequential patterns from customers′purchasing data[J].Electronic Commerce Research and Applications,2009,8(5):241-251.

[12]闻新,周露,王丹力,等.Matlab神经网络应用设计[M].北京:科学出版社,2002.

[13]胡理增,薛恒新,于信阳.以客户终身价值为准则的客户重要程度识别系统[J].系统工程理论与实践,2005,25(11):80-85.

SOM neural network-based mobile client segmentation study

Hu Guili,Yu Xin,Huang Qiuchan
(School of Computer,Electronics& Information,Guangxi University,Nanning 530004,China)

Type recognition problems such as characteristic unobvious,characteristic parameter stagger and nonlinear distribution can be effectively solved when self-organizing feature map(SOM)based on RFM model is applied into users subdivision.During the research,customer attributes are divided into recency,frequency and monetary,the three indicators simulate the function of the expert classification.Then,according to the features of each customer cluster, further analyzing lifetime value of customers, and utilizing quantitative analysis to value the importance of customers.Last,making use of relevant marketing management knowledge to propose corresponding marketing strategies for every customer type.

SOM neural network;RFM model;mobile communications;customer segmentation;marketing strategy

TP389.1

A

1674-7720(2015)23-0051-04

胡桂莉,喻昕,黄秋婵.基于SOM神经网络的移动客户细分研究[J].微型机与应用,2015,34(23):51-54.

2015-07-06)

胡桂莉(1990-),女,研究生,主要研究方向:计算机技术。

国家自然科学基金项目(61462006);广西自然科学基金项目(2014GXNSFAA118391)

喻昕(1973-),通信作者,男,博士,教授,主要研究方向:人工神经网络、电子商务和优化方法等。E-mail:YUXIN21@126.com。

黄秋婵(1993-),女,本科,主要研究方向:电子商务。

猜你喜欢
细分权值类别
一种融合时间权值和用户行为序列的电影推荐模型
CONTENTS
深耕环保细分领域,维尔利为环保注入新动力
壮字喃字同形字的三种类别及简要分析
基于权值动量的RBM加速学习算法研究
基于多维度特征权值动态更新的用户推荐模型研究
1~7月,我国货车各细分市场均有增长
服务类别
整体低迷难掩细分市场亮点
多类别复合资源的空间匹配