数据挖掘技术在银行CRM项目中的应用研究

2022-04-03 22:43孙庆莉高海霞
中国市场 2022年10期
关键词:数据挖掘

孙庆莉 高海霞

摘 要:进入21世纪以来,随着投资主体趋于多元化,金融服务体系日臻完善,各种复杂工艺技术日益成熟,世界范围内的项目大型化、群体化、复杂化的趋势愈加明显。伴随着经济全球化的深入进行和金融行业的进一步开放,我国实体金融遇到了极大挑战,以吸引新客户、保留旧客户、将已有客户转为忠实客户,从而为企业创造更多收益为最终目标的客户关系管理,成为了优质的选择。但海量复杂的客户数据使得传统分析方法望而却步,数据挖掘技术在银行CRM系统的应用研究,是在银行CRM系统中运用数据挖掘技术,对客户的海量业务数据进行针对性的分析和挖掘,进而达到对客户需求的精准掌握,对客户需求分类、对客户分类,为银行的决策提供支持,从而为客户提供更优质的服务,进而实现对单个用户价值的提高,最后达到实现利润超额的目的。

关键词:银行CRM;数据挖掘;分类算法;树模型

中图分类号:F832.2 文献标识码:A 文章编号:1005-6432(2022)10-0064-05

DOI:10.13939/j.cnki.zgsc.2022.10.064

1 数据挖掘与客户关系管理的关系

1.1 客户关系管理的内涵

客户关系管理出现在20世纪80年代的美国,刚刚从资本主义经济危机中复苏的美国,“接触管理”服务出现了,以收集客户与各种公司交流的信息为手段,帮助企业掌握正确接触客户的时机,CRM的概念逐步形成。CRM 是通过围绕客户细分来组织企业、鼓励满足客户需要的行为,实现客户与供应商之间联系,提高盈利、收入和客户满意的商业策略。CRM的主要关注点在客户,其主要目的就是建立、发展和保持良好的客户关系,以此来提高客户的满意度、忠诚度以及盈利性。

1.2 数据挖掘的内涵

数据挖掘,即从巨大的、不清晰的、随机的、繁杂的、不完整的、有噪声的数据中挖掘出隐含在其中的、潜在的、人们先前未知的具有使用价值的信息和知识的过程。在金融业中,数据挖掘被称作新型处理信息技术,优点是可以对海量的数据进行抓取、预处理、初步分析和综合处理,获得有利于产品更新和策略决策的关键数据。用户数据被录入或收集后进入系统底层的数据仓库,由于数據的来源不同或产生数据的活动不同,存放在不同的数据表中,例如客户数据表集、产品数据表集、客户互动数据表集等,经由不同层次的处理系统,经过采样、调整、统计分析或进一步的模型分析后,生成目标结果,输出既定格式,评价后进入下一轮数据采集。

1.3 数据挖掘与客户关系管理的关系

数据挖掘是银行客户关系管理的技术后盾。现代社会,几乎所有人都会和银行打交道,所以在这个角度上看,银行不需要担心客户的数量问题。但是怎样从数量巨大的客户群体中找到需要建立关系的优质客户,是新阶段银行最关心的一点。从经验分析来看,可以为银行提供真实效益的优质客户包括两类,第一类是有历史数据记录的高质量客户,此类型客户经济实力雄厚,或者是贷款大户(信用良好)或者是存款大户;第二类是没有历史记录的潜在的高质量客户,其具有经济实力,只是未曾出现在本系统中,需要银行的管理系统去发现并留存。通过数据挖掘和CRM去发现这些有潜力的高质量客户,使之成为本银行系统的客户,建立良好的业务关系,吸引优质客户并留存原有的高质量客户。

明确了已有的优质客户群体后,需要通过分析和挖掘找出优质客户的特征,发现高质量客户的关键因素,根据结果对客户进行分类,再根据分类规则拟定出个性化的客户关系管理策略。利用数据挖掘技术分析明确用户的真实需求,是发现和保留高质量客户的关键。

2 数据挖掘技术在银行CRM项目管理中的应用

2.1 商业银行CRM的客户数据内容与类型

银行客户数据可以分为以下三个方面。

(1)静态数据,客户基本信息,例如个人基本信息、已购产品、银行服务信息。

(2)动态数据,客户交易信息,例如客户资金的流动、资产的分布变动等。

(3)分析信息,客户关联信息,例如客户行为、情况变动、心理因素等。

这是基于经验对所有客户数据进行的理想划分,但是真正的情况是:银行已有的数据常常是日常流水的原始数据,纷繁复杂、没有分类,如基本信息(客户姓名、年龄、性别、电话、身份证号、婚姻情况、住房情况、家庭人口数、住址、工作单位、地点、工资收入、所在职位、总体收入)、产品情况(类型、期限等)、业务情况(客户代码、担保方式、信用等级、办理地点、服务人员编号等)。

2.2 数据预处理

几乎所有数据库都具有共同的特点:数据不一致、含噪声、不完整。这是因为实践操作中存在设备故障、信号中断、传输失误、人为录入错误等,此时直接使用数据,研究结果会出现很大的误差,所以在操作真实数据前需要进行有效的预处理。

(1)新建表单。初始观察的数据是采用单次记录方式的数据,各种数据库表单混合在一起,对数据的导出造成了极大的困扰,所以用SQL语句建新表单,导出专属本次研究的数据。

(2)缺失值与异常值的处理。操作如下:删除贷款金额为空的数据;剔除年龄异常小的数据。

(3)脱敏处理。将姓名更换为编号,将精确的贷款次数分级为1次、2~5次、5次以上,将具体的贷款期限概括为短期贷款(≤1年)、中长期贷款(1~5年)、长期贷款(5年以上),经过本次处理,共剩余1905条数据供研究。

2.3 银行A已有客户特征分析

首先从样本角度对客户情况进行总体层面的分析,期望可以借此对银行A客户的基本情况有更加全面的了解。

(1)年龄分布情况,如图2所示。

(2)性别分布情况,如图3所示。

(3)贷款次数与贷款期限情况,如图4所示。

2.4 树模型的建立

分析了客户群体的基本情况之后,开始构建模型,将整理好的数据导入SPSS软件,操作后输出树模型图以及评估模型准确性的相关结果图,并对結果进行整理和解读,最后基于挖掘结果对银行客户类型进行分析。

(1)CART树模型的构建。树模型如图5所示,为了评估模型的准确率及选择变量的重要性,同时输出分类四格表(表2)、自变量重要性表(表3)以及Risk统计量表(表4)。

从CART生长法给出的二叉树模型可以看出,共有6层18个节点。节点0为本树模型的根节点;节点1、2、4、5、7、8、13、14为中间节点,是本次分类的中间过程;叶子节点:3、6、9、10、11、12、15、16、17、18,每个叶子节点都有一条路径到根节点,形成一条分类规则,每个叶子节点对应了一条分类规则,树模型有10个叶子节点,对应着10条分类规则。

分类规则如表1所示。

(2)CART树模型的评价。

从表2分类四格表可以看出,树模型预测值与观测值相同的总体百分比为89.6%,表4可以看出Risk统计量是0.117,说明错估概率为11.7%,预测正确率约为88.3%,模型拟合的效果比较好。分类表与风险表预测结果有1%的误差,但是均超过85%,结果较好。

(3)基于挖掘结果的银行客户类型分析。从树模型可知总体情况为:在1905条用户数据中,54.7%的用户也就是1042位客户没有依照合同时间还款;863名客户履行条约进行还款,占总数的 45.3%。而分类最主要因素是贷款类型,申请生产经营型贷款的客户70%以上都进行了还款,消费类的客户有67.8%没有依照合约还款,银行可依据此明显属性进行控制。

接下来从叶子节点入手,10个叶子节点里6个节点的结果是违背合约还款,只有4种情况的客户会履行合约。根据树模型结果将客户分为以下七类:

第一类:叶子节点3,贷款类型为消费类型且金额小于等于59500元的客户。小额贷款用于消费,所以对客户来说比较容易还款,手中的流动资金较多时就可以申请还款。

第二类:叶子节点11、12,贷款类型为消费类型,金额大于59500元且小于等于100500元的客户,此类客户可能是本身条件不够好,贷款还车贷或者购买超出能力范围的商品,所以不能及时履行合约还款。

第三类:叶子节点15、16、18,贷款类型为消费类型,贷款金额超过10万元且年纪小于40.5岁,这类客户可能是职场人士,在房贷和养家糊口的压力下,资金不够于是向银行贷款,又由于购物等原因,无法及时还款。

第四类:叶子节点17,消费型贷款超过15万元,年龄大于40.5岁。这类人摆脱了房贷压力,向银行贷款可能是由于帮子女临时筹措购买房子的首付,但由于经济压力小、有积蓄(具备较高的经济实力)而且不喜欢逾期还款,所以可以及时地履行合同进行还款。

第五类:叶子节点9,申请生产经营型贷款且以别人的担保为条件进行贷款的用户,在贷款次数仅有一次的情况下,很多人都没有即时还款的积极性,或者因为自己没有能力抵押才选择的贷款,所以到期可能也没有能力即时还款。

第六类:叶子节点10,生产经营型贷款的客户,在别人担保的情况下已经有多次贷款的记录,别人可以多次帮助其担保,说明其有能力还款,事实也证明了其可以履约。

第七类:叶子节点6,此类客户以资产抵押的方式进行生产经营类贷款,其中88.4%的人由于抵押了自己的某些资产,在对资产的重视下,可以通过经营收入归还银行贷款,也有11.6%的人由于经营不善或者其他因素无法按时还贷。

针对以上七类客户的特点,银行可以制定相应的策略,增加回收贷款的概率。

3 银行CRM项目管理的策略

3.1 客户分类与分级管理

亚特兰大公司曾做过一次行业调查,结果说明银行不同等级的客户所带来的收益有着相当大的区别,对于前20%的客户,收益是成本的6倍甚至更多,但是对于末尾20%的客户,收益是成本的1/3甚至更少。这为银行的管理提供了一个很好的思路,就是对待客户不要“公平”,因为他们创造的价值就不是“平均”的,要让价值高的客户得到价值高的服务,也要使不同类型客户对银行的服务都可以感到满意,这就需要分类分级管理。根据树模型给出的基础分类,凭借经验罗列了七类客户类型,并相应地给出了服务和产品推荐策略。随着银行CRM系统的迭代和数据更充分的利用,可以为客户行为做出更好的分析,提供更好的分类结果和更有效的策略建议,就可以为银行带来更高的效益。有了这种分类和分级的办法,当银行出现一个新用户的时候,就可以打破往日模式单一的应对方式,以新用户所属类别的服务策略做出应对方案。

3.2 客户维护及接触式管理

当今时代,各行各业的竞争压力日益增大,尤其服务业的竞争,在产品类愈来愈相似的情况下,仅凭借同质性的产品是无法吸引和占据市场的。市场营销学曾经提出了客户的接触式管理,用在银行这里就是指银行为客户提供服务和产品,客户在体验了产品和服务后将感受和建议反馈给银行,使得银行可以得到提高与发展,从而吸引更多的客户和利润。客户维护方面,以往银行会使用同样的营销策略,但因为客户的需求不同,造成人力资源的浪费,结果很不理想。所以实现接触式管理意味着要明白客户需要什么,后期保持客户忠诚度时也可以明白客户的喜恶情况。

3.3 服务产品更新迭代

在提供了明确的客户分类服务方案后,银行也应该清楚,客户的类型远远不止这几类,产品的类型也有着更多的对应人群,而且金融类产品很容易被模仿,所以,银行要及时地对产品进行更新、不断迭代,明晰客户的需求,适时地更新自己的产品和服务,以满足客户群体变化的需求,让客户感受到产品的吸引力。保证客户的忠诚度,就是保证了银行的收入。现阶段,银行拥有数据挖掘技术支持的CRM系统,可以从最烦琐的业务流程数据中分解和分析出客户偏好,作为银行方面的管理层和产品制定人才可以有针对性地制定新的产品方案以迭代效果较差的营销策略,保证各个产品的购买率,保证服务人员的努力没有浪费,保证销售人员的高效率。

3.4 保证数据质量

数据挖掘,就是对数据进行挖掘。数据的重要性毋庸置疑,不仅仅是数量的级别要够,数量的质量也是重中之重。如果作为任务的根本——数据的真实性存疑,那么即使选取了最好的挖掘算法也不会得到理想的结果,所以需要对数据严格控制,尤其在银行这种流程复杂、数据库繁多的系统内部,需要更加用心地控制数据源的真实性,在所有环节都要用心,这样才能为模型的建立提供优质的数据,进而收获高质量的挖掘结果。

3.5 适当选择算法

数据挖掘自出现以来得到多方重视,拥有着非常多的经典算法,所以算法的选择需要严肃考虑,选择和目标匹配的算法是实现目标的关键,明确目的,再了解数据的情况,两者相结合再进行算法的确定,要十分严谨。在模型的建立阶段,训练集数据要不断地调整,测试集与训练集的比重也要不断调试,要量化真实的数据就要不断地探索。在得到结论前,要避免过度拟合的出现,在得到结论后,也不能过度依赖分组,在结果严重偏离实际时考虑数据原因,并用实践去检验对错,及时更新模型合理使用结论。

参考文献:

[1]吉阳.数据挖掘在银行客户关系管理中的应用研究[D].石河子:石河子大学,2016.

[2]林珊.GY公司客户关系管理计划[D].广州:华南理工大学,2010.

[3]周军.SQ集邮公司客户关系管理研究[D].西安:西安理工大学,2006.

[4]李麦丽.基于客户满意度视角的S公司客户关系管理问题及对策研究[D].青岛:青岛科技大学,2016.

猜你喜欢
数据挖掘
数据挖掘技术在打击倒卖OBU逃费中的应用浅析
基于并行计算的大数据挖掘在电网中的应用
一种基于Hadoop的大数据挖掘云服务及应用
数据挖掘的分析与探索
数据挖掘技术综述与应用
基于GPGPU的离散数据挖掘研究
利用数据挖掘技术实现LIS数据共享的开发实践
高级数据挖掘与应用国际学术会议
高级数据挖掘与应用国际学术会议