基于电力敏感客户预测模型的营商环境优化提升研究

2020-09-02 07:14韦雅孙卉田珂马波张利鹏
微型电脑应用 2020年8期
关键词:增益决策树变量

韦雅 孙卉 田珂 马波 张利鹏

摘要:

近年来,党中央、国务院持续推进“放管服”改革,加快政府职能深刻转变,通过优化营商发展环境来激发市场活力。研究的目的是建立相关的预测模型,研究影响对投诉事件发生概率有显著影响的重要因素。基于某地区SG186营销系统、95598业务支持系统客户信息数据,充分挖掘数据内在联系,运用数据预先清洗机制进行影响因素初步筛选,运用改进的决策树学习算法来建立模型,并对模型效果进行充分验证,有效识别电力敏感客户。同时,针对特定投诉敏感客户,提出适应电力企业发展的精准营销策略,优化提升电力营商环境水平。

关键词:

优化提升; 改进决策树算法; 电力敏感客户; 营商环境; 预测模型

中图分类号: TP 274

文献标志码: A

Research on Business Environment Improvement Based on

Power Sensitive Customer Prediction Model

WEI Ya1, SUN Hui2, TIAN Ke2, MA Bo3, ZHANG Lipeng4

(1. Customer Service Center, Henan Electric Power Research Institute of State Grid, Zhengzhou, Henan 450006, China;

2. State Grid Company Henan Electric Power Co. Ltd., Zhengzhou, Henan 450016, China;

3. Beijing National Network Communications Accenture Information Technology Co. Ltd., Beijing 100032, China)

Abstract:

In recent years, the CPC Central Committee and the State Council have continuously pushed forward the reform of "release and control uniforms", accelerated the profound transformation of government functions, and stimulated market vitality by optimizing the business development environment. The purpose of this study is to establish relevant prediction models and study the important factors that have significant impacts on the probability of complaint incidents. Based on the customer information data of SG186 marketing system and 95598 business support system in a certain area, the internal relationship of data is fully excavated, influencing factors are preliminarily screened by using data precleaning mechanism, a model is established by using improved decision tree learning algorithm, and the effect of the model is fully verified to effectively identify power sensitive customers. At the same time, aiming at specific complaintsensitive customers, this paper puts forward precise marketing strategies to adapt to the development of electric power enterprises, and optimizes and improves the environmental level of electric power business.

Key words:

optimizing promotion; improving decision tree algorithm; power sensitive customers; business environment; prediction model

0引言

電力改革深入推进,要求电力公司持续提升营商环境水平[13]。新时代,电力客户需求向多样化发展,向电力服务提出更高标准和要求[4]。这就导致电力行业供需双方之间的矛盾,加上电力行业的客户具有分散的特点,涉及的面广,层次较多,需求呈现差异化,更加剧了两者之间的供需矛盾[5]。首先,电力产品所具有的特殊的社会服务职能决定了它是人们生活的必需品;其次,客户的维权意识加强,通过多种渠道投诉来表达他们对供电公司的不满情绪和态度,如电话、电子邮件、传真、信函、上访等,直接影响电力公司社会形象。最后,电改促进售电市场全面开放,电力市场竞争更加激烈,频繁的投诉会降低客户对供电公司的满意度,造成客户流失现象[68]。

随着售电侧市场改革进程的推进和国家关于提升营商环境的具体要求,降低客户投诉率,提升供电公司服务水平至关重要。国内外研究学者针对客户数据进行相关性分析,实现投诉敏感客户需求分析,以此提升企业服务水平。郝然等人基于收集的配用电数据,对数据进行聚合和处理,提出以大数据平台为基础的整体架构应用,并实现了流处理、批处理等数据驱动,对用电模式实现精准识别,提升精准用电管理水平,实现个性化营销服务[9]。潘亮等对收集的投诉数据进行深度挖掘,关联客户感知预警与网络信息,促进供电公司及时发现异常情况,为网络维护和优化提供指导,确保客户投诉问题的及时解决,提升网络质量和客户满意度[10]。而电力客户用电数据采集频度的提升,使得对电力客户的用电行为进行更深层次的分析变得更加便捷[11]。李树国等基于国网蒙东公司的业务数据,对数据进行了深度挖掘,并应用二元Logistic回归,完成客户投诉预测模型的构建,精准识别了投诉客户,事前解决投诉事件[12]。赵少东等针对供电服务特点,从客户账务和停电敏感出发,构建基于熵值法的电力客户敏感度评价模型,为供电企业服务部门能有效制定精准化客户服务策略提供依据,有效提升服务能力和客户体验,实现降本增效[13]。

随着电力市场日益完善,客户对电力服务需求也愈加强烈,电网公司应时刻关注客户需求变化,采取及时、有效的对策提升客户服务水平。本文研究的目的是建立预测模型,研究影响对投诉事件发生概率有显著影响的重要因素。由于数据量较大且所分类别较多,本文将定性与定量分析相结合,运用逻辑回归进行影响因素的初步筛选,运用改进的决策树学习算法根据不同客户需求和行为构建电力客户投诉预测模型,提出对应的服务策略,提升供电公司市场竞争力。

1电力投诉敏感客户模型构建与应用

1.1目标客户

结合对业务的理解及对现有数据的初步分析,明确投诉客户敏感度的定义。不同客户的需求和行为不同,对应其投诉敏感度的影响因素也存在差异。因此,供电公司面临不同客户的敏感度表现也应匹配相应的业务应对策略。本文选取三种投诉敏感类型的用电客户,建立相应的投诉敏感度预测分析模型。

1.2模型思路

如图1所示。

敏感分析通过数据挖掘指标,应用逻辑回归、决策树等方法进行分类预测,完成客户需求模型的构建,并对模型进行评估。

1.3数据准备

文章中主要考察的数据为某区域2015年2017年95598客户服务系统、电力营销系统等数据,开展模型训练,具体数据明细,如表1所示。

在以上建立模型所考察的数据当中,我们从3个类别中选取了20个类别的客户信息,如行业特征、电压等级、用电量、平均电价等,并对数据进行预处理。由于这些数据中包含了数值数据和非数值数据,因此在这里选用逻辑回归模型,将这些特征数据加权一起参与到决策过程中是最为有效的方法。

1.4决策树算法建模

1.4.1变量类型转换

在这之前,我们先进行简单的变量类型转换。通过将20项指标分为两类变量:分类型变量和数值型变量。其中分类型变量包括投诉敏感类型、行业特征、是否电费敏感、是否停电敏感、电压等级、用电类别、缴费方式、电费结算方式;数值型变量包括用户编号、容量、户龄、用电量、电费、平均电价、近3个月电费环比、近3个月电费同比、历史拨打次数、催费次数、停电次数、停电时长。

分类型变量采取按类别方式转换,不同类别以0、1、2等不同数字作为标签。其中电压等级虽然表现形式是数值,但其主要用于分类,本身没有大小比较关系,只代表一种类型。

数值型变量主要采用等距直方图的方法进行分组,即在变量区间中插入K个数值,以将其等分成K+1个小区间;再以插入的各个数值作为分段点,进一步将区间划分成各更小的子区间,形成可用于决策树训练的数据集[14]。此方法可以进行大多数数值型变量的转换,但是对于历史拨打次数、催费次数、停电次数、停电时长这些用直方图方法分类结果分组数量过多的变量,需要用WOE值进行进一步合并,以减少分组数量,IV值(没有定义)的计算公式如式(1)。

式中:

pi=p(Y=yk|Xi=xij)表示属性变量Xi=xij时样本类别为Y=yk的概率值,qi=p(Y≠yk|Xi=xij)表示属性变量Xi=xij时样本类别为Y≠yk的概率值。可以看出,WOE越大,Y=yk的实例越多,权重越大,其可作為判断属性的某种取值对分类结果导向性的一种度量。

以“历史拨打次数”为例,其取值范围为[0,30],如果采用等距直方图的方法,以1为步长构建该变量的等差数列,共有30个分组。为降低模型复杂度,需减少其分组个数,将缩减为5组,共有C530种方法,可按照上面公式计算WOE值,选择其最大的合并方式,其结果如表2所示。

然后使用R软件的类型转换函数,并借助as.factor函数,实现变量类型转换。

1.4.2决策树算法建模

决策树算法是一种逼近离散函数值的方法,通过对数据进行处理,利用归纳算法生成可读的规则和决策树,然后使用决策对新数据进行分析[15]。其中,比较著名的算法有ID3算法和C4.5算法。

在构建用于识别敏感客户的模型时,涉及到了多种、不同形式的数据,C4.5算法是一种基于ID3算法进行的改进算法,其对于变量的缺失值进行了一定程度的处理,并且采用快速收敛的剪枝技术,极大的提高了决策树的处理能力,并且具有了对连续型属性相关问题的处理能力。由此建立的决策树模型非常直观,易于人理解和应用;并且决策树搭建和应用的速度比较快。同时放宽了对于数据分布的要求,受缺失值和极端值对模型的影响很小。(为什么用)C4.5决策树算法是用于基于数据集选择最佳分区属性的方法。所谓最佳分区属性,对于简单分类而言,就是尽可能地将类别相同的样本聚合,使其分在一类,即“纯度”最高的属性。

首先,通过以下公式求得样本集的信息熵如式(2)。

其中,pk是当前样本D中第k个样本的比例,K是类别的总数(对于二进制分类而言,K=2)。Ent(D)的值越小,D所代表的纯度越高,但它偏好具有大量值的特征的数量(也就是说,属性可取的值越多,其计算结果越倾向选择该值),由于特征可取的值越多,会致使样本“纯度”越大,即Ent(D)会很小。

由此引入信息增益的概念,假定离散属性x有N个可能的取值{x1,x2,…,xN},如果使用特征x来对数据集D进行划分,就会出现N个分支节点,其中第n个节点包含了数据集D中所有在特征x上取值为xn的样本总数,记为Dn。所以,可依据前面信息熵的公式计算出信息熵,再根据各个分支节点分别具有不同的样本数目,给分支节点赋予权重[SX(]|Dn||D|[SX)],故能计算出依据属性x对样本集D具行区分所得的信息增益如式(3)。

一般而言,信息增益越大,表明该特征对数据集划分获得的“纯度提升”越大。但是其对可取数值多的属性有偏好的缺点,致使类似数据序号这类对分类影响很小的属性的信息增益很大,基于此建立的模型不具备泛用性。因此,引入“信息增益率”这一概念,如式(4)。

其中IV(x)为属性x的“固有值”,属性x的可能取值数目越多(即N越大),则IV(x)的值通常会越大。这也就产生了另一个问题,即信息增益率可能对可取数目较少的属性有所偏好。

为了避免上述问题,C4.5决策树算法不直接选择具有最大增益率的候选分区属性,而是选取信息增益高于平均水平的同时增益率较高的属性,作为当前决策树的根结点。根结点每一个可能的取值对应一个子集或一个划分,对训练样本子集递归地进行信息增益和信息增益率的计算,选取最佳属性结点,直到每个划分(子集)中的观测数据在分类属性上都取相同的值,最终生成决策树。

最后,根据训练集构造的决策树提取分类规则,再根据分类规则对海量数据集进行分类处理。

1.5模型训练

将上述一系列处理后的数据按7∶3(经试验,该分割比例能取得最好的分类准确率)进行随机分割,形成训练集和测试集,其目的是拿70%的数据用来训练模型,用剩余的30%的数据用来检验模型的分类效果。

将以上处理好的数据,在分割好的训练集上,通过R软件分析平台,使用C4.5决策树模型进行训练,计算出各个指标对因变量的信息增益率,选取信息增益率较大的因素作为关键变量,得到投诉敏感度模型。各变量的信息增益率如表3、表4所示。

根据上表结果,重要性大于5的变量为对客户投诉敏感度影响较大的重要变量,包括用电量、电费、近3个月电费同比、近3个月电费环比、历史拨打次数、催费次数、停电时长和是否电费敏感这8个因素,各因素的投诉敏感特征重要性,如图2所示。

1.6预测结果输出

根据以上数据处理及模型训练,得出客户敏感度分类结果,如图3、图4所示。

其中投訴敏感类型为模型预测类别,客户敏感度分为高度敏感(0)、中度敏感(2)和低度敏感(1)3个等级。

1.7模型效果评估

将测试数据代入C4.5决策树模型进行模型评估,评估结果如下图5所示。

其中,各类命中率表示预测类别中预测正确的概率,各类覆盖率表示实际类别中模型预测正确的概率。最终模型的综合正确率为85.32%,达到正确率高于75%的要求的同时,确保了不会将高敏感度用户误判为低敏感度用户,有效保证了公司的服务质量。

2投诉敏感客户精准营销策略研究

为促进营商环境持续改善,针对电力投诉敏感客户,制定6项重点改进措施,提升客户投诉管理工作,如图6所示。

2.1识别投诉倾向客户

为提升服务满意度,降低投诉率,通过对客户服务历史和行为轨迹进行回溯,当发生投诉业务时,客服人员能根据客户投诉原因,结合客户身份特征和个人偏好等快速做出响应,提前做好应对策略,降低客户未来继续投诉的风险。例如,对“电费过高投诉倾向”的客户,一方面要尽快找出用户账单明细,另一方面可以从相关政策、抄表周期、电量对比、天气及节假日等方面进行引证据典,对客户加以引导和解释,消除客户疑虑;例如,对“停复电信息投诉倾向”的客户,提前查询停电开始时间、停电结束时间、停电原因、停电范围等信息,对客户进行解释,消除客户疑虑。

2.2构建投诉绿名单用户以95598投诉话单数据库为基础,提出“投诉客户绿名单策略”,将所有已投诉客户维护进“投诉客户绿名单”中。

2.3采取投诉转化为咨询/报修服务策略

客户来电时,通过客户投诉倾向,结合客户基本属性,合理采取相关策略,对客户加以引导,消除客户投诉疑虑,提升服务品质和客户满意度。针对“抢修进度投诉”的客户,首先对故障报修抢修人员的实时处理进度进行了解,同时采取耐心倾听、表示同情理解并真情道歉、分析原因并尽快解决的方法进行处理,最后达成一致,形成统一战线,引导客户打消戒备心理,将投诉转化为咨询故障报修处理进度。“计量问题投诉倾向(电费查询)”的客户,采取巧妙请教法、耐心倾听法、跟进实施法与客户达成共鸣,尽快跟进处理进度,确保问题尽快解决。

2.4合理处理专业投诉用户

在现状分析中,可以看出当迎峰度夏/迎峰度冬投诉量最高,会出现话务峰涌,会产生大量故障工单,故障工单处理不及时可能会导致用户投诉。通过对客户基本属性分析,针对投诉敏感客户,优化资源配置,提前并优先安排抢修人员对故障进行处理,处理完成后及时回访。

2.5话务峰涌期间优先处理投诉敏感客户

在现状分析中,可以看出当迎峰度夏/迎峰度冬投诉量最高,会出现话务峰涌,会产生大量故障工单,故障工单处理不及时可能会导致用户投诉。通过对客户基本属性分析,针对投诉敏感客户,优化资源配置,提前并优先安排抢修人员对故障进行处理,处理完成后及时回访。

2.6针对特殊投诉客户适时给予人文关怀

周期性主动给客户沟通,了解和关心此阶段用电情况;适当安排企业代表对客户进行家庭慰问,对客户及其家人对供电工作支持表示感谢;客户生日时,通过短信对客户祝福;节假日时,可以适当提供一些优惠措施比如适当增加积分;也可以通过有偿组织旅游的方式与客户做进一步交流,增强彼此的信任度。

3总结

本文充分应用SG186营销系统、95598业务支持系统客户信息数据,运用逻辑回归进行影响因素初步筛选,运用改进的决策树的学习算法来建立模型,精准识别区域投诉敏感客户,并针对性的制定6项精准营销服务策略,优化提升了电力行业营商环境水平,为电力公司精准营销提供有力支撑。

参考文献

[1]

郭笑侬.关于电力体制改革对电网企业的影响分析[J].企业改革与管理,2019(1):196197.

[2]韩亮,解嘉彬,潘华.电力体制改革新形势下电网企业经营策略研究[J].财经界,2019(3):9698.

[3]耿俊成, 张小斐, 袁少光. 基于逻辑回归模型的电力客户停电敏感度评分卡研究与实现[J]. 电力需求侧管理, 2018, 20 (3):5256.

[4]吴敏辉.基于电网电压暂降敏感用户服务的優质电力营商环境构建[J].机电信息,2019(12):124125.

[5]袁捷.大数据时代的数据治理[J].中国电力企业管理,2016(21):3234.

[6]郝然,艾芊,肖斐.基于多元大数据平台的用电行为分析构架研究[J].电力自动化设备,2017,37(8):2027.

[7]周汉峰.供电企业电力营销管理的创新发展探析[J].低碳世界,2017(26):141142.

[8]陈晨,董晓天,管文林,等.新电改形势下地区供电公司服务模式与售电业务研究[J].电气技术,2017(10):512.

[9]陈珍,崔峰,夏徐东,等.电力改革对现电网及其营销模式的影响研究[J].国网技术学院学报,2016,19(2):2428.

[10]潘亮,常哲,孙琳.基于大数据挖掘的客户感知预警与投诉热点病历库系统[J].山东通信技术,2014,34(4):1719.

[11]王成亮,郑海雁.基于模糊聚类的电力客户用电行为模式画像[J].电测与仪表,2018,55(18):7781.

[12]李树国, 李楚君. 基于Logistic回归的电力行业投诉预警模型[J]. 自然科学(文摘版), 2016(8):4345.

[13]赵少东, 王程斯. 基于熵值法的电力客户敏感度综合评价模型研究[J]. 电工技术, 2018(11):4850.

[14]吴敏辉. 基于电网电压暂降敏感用户服务的优质电力营商环境构建[J]. 机电信息, 2019(12):130131.

[15)刘琳, 余顺坤, 吴轶群,等. 基于熵值法的电力企业二元绩效积分制考核模型研究[J]. 华北电力大学学报(自然科学版), 2012, 39(2):7478.

(收稿日期: 2019.08.03)

基金项目:

国家电网有限公司科学技术研究项目(YF18012011P)

作者简介:

韦雅(1970),女,本科,高级工程师,研究方向:电气工程及其自动化、泛在电力物联网技术等。

孙卉(1976),女,硕士,高级工程师,研究方向:电力系统自动化等。

田珂(1978),女,本科,高级工程师,研究方向:电气技术等。

马波(1994),男,本科,研究方向:泛在电力物联网等。

张利鹏(1988),男,硕士,研究方向:泛在电力物联网等。

文章编号:1007757X(2020)08002305

猜你喜欢
增益决策树变量
经典仪表放大器(PGIA)的新版本提供更高的设计灵活性
简述一种基于C4.5的随机决策树集成分类算法设计
旦增益西的藏戏梦
宽频带增益放大器的设计与测试
放大器仿真设计
决策树学习的剪枝方法
分离变量法:常见的通性通法
决策树在施工项目管理中的应用
不可忽视变量的离散与连续
轻松把握变量之间的关系