基于聚类分析的客户分类研究

2021-09-10 05:10郑博
家园·建筑与设计 2021年5期
关键词:中心点年收入聚类

郑博

摘要:大数据时代下,企业营销焦点从产品中心转变为客户中心,客户关系管理成为企业核心问题。本文利用K-Means聚类方法对客户分类,针对不同客户的特征采取不同的营销策略,实现企业利润最大化。

关键词:K-Means聚类;客户分类

Abstract:In the era of big data,the focus of enterprise marketing has changed from product center to customer center,and customer relationship management has become the core issue of enterprises. In this paper,K-means clustering method is used to classify customers,and different marketing strategies are adopted according to the characteristics of different customers to maximize the profits of enterprises.

Key words:K-Means cluster;Customer classification

一、引言

在大數据时代,客户关系管理对一个企业来说越来越重要,而客户分类又是客户关系管理中的关键问题。面对激烈的市场竞争,尝试对客户进行分类,了解不同类型的客户特征,以便可以向营销团队提供意见,针对不同的客户类别制定不同的营销策略,实现精准营销,有助于实现公司利润目标的最大化。

二、问题分析

由于客户没有类别属性,所以对客户分类是一个无监督学习的任务,对此,我们可以对客户进行K-Means聚类,根据聚类结果来判别客户的类型。本文基于客户信息的年龄、年收入和消费积分数据来进行案例分析。在做K-Means聚类分析之前,本文利用直方图可视化分析客户的年龄、年收入、消费积分的特征分布,有助于了解客户特征。

三、K-Means聚类介绍

K-Means是一种基于距离的聚类算法,其算法过程如下:

1)随机选取K个样本对象作为初始的聚类中心点。

2)计算各样本与每个中心点的距离,并将样本划分到距离最近的中心点所在簇。

3)样本划分完成后,计算每簇样本坐标的均值,并以此为新的中心点。

4)重新计算各样本与每个中心点的距离,若存在样本所属簇发生变化则转2),否则转5)。

5)当所有样本所属簇不再发生变化时停止并输出聚类结果。

四、客户基本信息特征分析

对企业客户的年龄、年收入、消费积分做直方图有:

由图可见,年龄上,客户主要集中在20-50岁左右,其中30-40岁年龄段人数最多,反映出中青年为主要客户来源。年收入方面,客户大多处于40-80千元段,年收入超过80千元后,客户数急剧减少。客户消费积分主要集中在40-60积分段。

五、建立K-Means聚类模型及可视化

首先对数据做标准化处理,再利用Calinski-Harabaz指数辅助确定聚类的K值取6。利用Python建立K-Means聚类模型,对模型结果做雷达图有:

图中Age为年龄,Annual_Income为年收入,Spending_Score为消费积分。

可以看出6类的数据特征依次为:第一类客户:青年人、低收入、高消费。第二类客户:中年人、低收入、低消费。第三类客户:青年人、高收入、高消费。第四类客户:青年人、中等收入、中等消费。第五类客户:中老年人、中等收入、中等消费。第六类客户:中年人、高收入、低消费。

六、分析建议

可以看出对于青年人,其消费水平高,但仍有部分中等消费水平的青年人可待挖掘消费潜力。对此可以针对第四类客户,进一步深入分析,探索这部分客户的消费需要,完善企业的产品种类。

对于中年人不论收入高低,其消费水平均偏低,消费潜力没有被开发出来。可见企业产品对于中年人吸引力低,对此研究中年人的客户需求,开发相关产品可以弥补企业对该客户群体消费的缺失。

猜你喜欢
中心点年收入聚类
Scratch 3.9更新了什么?
基于模糊聚类和支持向量回归的成绩预测
如何设置造型中心点?
磨课,一段痛苦与快乐交织的过程
基于流形学习的自适应反馈聚类中心确定方法
基于密度的自适应搜索增量聚类法
最难成为1%人群的美国州
重税国
美国这些医疗保健岗位在2016年最热
寻找视觉中心点