基于数据挖掘的油企客户访问行为分析

2022-07-12 07:48郭阳秦
中国石油企业 2022年4期
关键词:门户网站浏览器标签

□ 文/郭阳秦

作者单位:昆仑银行运营服务中心

传统以“产品为中心”的时代已经结束,以“客户为中心”的时代已经到来。石油企业客户每天办理各项银行业务,同时产生了海量信息。基于银行客户行为数据进行存储、分析,挖掘客户行为数据背后隐藏的有效信息,具有很大的商业价值和社会价值。这已成为当前数据挖掘技术一个新的研究热点和应用领域。本文通过大数据平台提取客户访问银行网站属性数据,开展对客户访问行为的分析。通过对客户行为分析,挖掘访问行为的关键因素,制定针对性服务的策略。

一、客户访问行为具体方法

基于大数据因子分析的客户访问行为分析的总体流程如图1。

图1 因子分析流程图

主要流程包括以下步骤:1)从门户网站提取客户访问门户的行为数据;2)对1)中提取的数据进行预处理;3)对2)中处理完成的建模数据进行因子分析;4)对因子分析结果进行分析和应用。

1.数据提取。门户网站访客数据量每日近10万条。为理论研究,随机抽取了2017年11月1日至2020年12月31日的数据进行挖掘,部分数据截图见图2。

图2 分析数据截图

2.数据探索分析。对原始数据表进行分析,客户每条访问记录都会存在多条记录,存储不同信息,根据对数据的初步分析,可以提取访问间隔时间、访问时长、访问次数、网络接入商、操作系统、浏览器等属性数据,涉及客户、访问次数、省市、接入商、操作系统、浏览器等不同维度。

3.数据预处理。

1)数据清洗。通过数据探索分析,发现数据存在空值,无效记录,时间格式数据需要进行加工和变换,清洗满足条件的所有数据,保证数据的有效性。数据清理情况见图3。

图3 门户网站客户访问数据清理

2)属性规约。通过原数数据表分析,部分属性无价值,对数据表中不需要的属性进行剔除,如访问深度、分辨率等,保留需要的数据。

3)数据变换。因子分析需要数值数据,因此需要对部分数据进行变换处理为建模数据,根据客户的浏览器、操作系统、网络接入商赋予对应值,见表1。

表1 属性变换规则表

经过数据预处理后的建模数据,部分数据见表2。

表2 建模数据

4.数据建模与因子分析。一是通过SPSS软件使用因子分析算法,对客户访问行为属性进行挖掘。二是对挖掘结果可行性检验。通过使用KMO和Bartlett算法对结果进行检验。根据KMO统计量大于0.7和Bartlett的sig显著值小于0.05,确定本案例可以采用因子分析提取公因子。三是对提取因子解释度分析。根据解释的总方差表和碎石图,提取出的特征值大于1的3个因子,方差解释的合计解释度为83.219%(解释度大于80%),表明提取的因子可以很好解释原来变量中的信息。四是对提取因子结果进行解释分析。五是综合各项因素对访问行为因子综合计算,得到关注银行门户网站客户分布情况。

二、实施效果分析及推广应用

在挖掘客户访问银行门户网站属性数据过程中,通过因子分析“降维”,聚焦在了客户访问的间隔时间、访问时长、访问次数、网络接入商等6个访问维度。综合各项因素权重后得到影响客户访问的3个“标签”分别为终端、网络和关注度。这3个标签成为了访问门户网站用户的重要关注因素。再对3个“标签”进行细分。经过对成分矩阵挖掘分析,“终端”标签中最重要的是操作系统和浏览器,“网络”标签中最重要的是接入商和间隔时长,“关注度”标签中最重要的是单次访问时长。为提高客户的满意度和黏性,银行应重点做好以上关注因素的软件兼容性、功能的易用性和界面的友好性。

根据客户访问行为综合数据,可对重点关注客户的地域分布进行“画像”统计(取综合因子大于0.5的客户),并制作重点关注客户地域分布图。

从图4可以看出,银行访问门户网站的重点石油客户群集中在新疆、陕西、黑龙江和北京等地,银行可以投入更多资源和营销力度开发相关地域客户。

图4 重点关注客户地域分布图

本研究方法可以广泛应用于石油客户营销分析(如客户喜好分析、客户满意度调查等)、经营决策(如营销活动策划、差异化服务策略等)等领域中。本模型特别适用于寻找关键影响因素的场景,如:盈利增长主要贡献因素、影响业务效率的主要因素等等,这为银行海量信息挖掘提供了借鉴意义。

猜你喜欢
门户网站浏览器标签
微软发布新Edge浏览器预览版下载换装Chrome内核
反浏览器指纹追踪
无惧标签 Alfa Romeo Giulia 200HP
不害怕撕掉标签的人,都活出了真正的漂亮
YouTube
让衣柜摆脱“杂乱无章”的标签
科学家的标签
中国省级教育门户网站排行榜等
中国省级教育门户网站排行榜等
中国省级教育门户网站排行榜等