基于并行分类算法的电力客户欠费预警

2016-06-28 09:08陈羽中郭松荣陈宏李婉华郭昆黄启成
计算机应用 2016年6期
关键词:随机森林时间序列

陈羽中 郭松荣 陈宏 李婉华 郭昆 黄启成

摘 要:针对供电企业“先消费后付款”的经营模式可能造成用电客户因失信引发的欠费风险,需要在用电客户欠费行为发生之前实时快速地分析海量的用电用户的数据,给出潜在的欠费客户名单的问题,提出一种基于并行分类算法的电力客户欠费预警方法。首先,该方法使用基于Spark的随机森林(RF)分类算法对欠费用户进行建模;其次,根据用户以往历史用电行为和缴费记录使用时间序列进行预测得到其未来用电和缴费行为特征;最后,使用之前得到的模型对用户进行分类得到未来潜在高危险欠费用户。将该方法与并行化后的支持向量机(SVM)算法和在线序列极限学习机(OSELM)算法进行对比分析,实验结果表明,所提方法相对于对比算法在准确率上有较大提高,便于电费回收管理人员进行提前催缴,确保电费回收的及时性,有利于电力企业进行客户欠费风险管理。

关键词:欠费预警;随机森林;并行算法;时间序列;海量数据

中图分类号: TP311.5 文献标志码:A英文标题

猜你喜欢
随机森林时间序列
随机森林在棉蚜虫害等级预测中的应用
基于二次随机森林的不平衡数据分类算法
拱坝变形监测预报的随机森林模型及应用
上证综指收益率的影响因素分析
基于指数平滑的电站设备故障时间序列预测研究
基于时间序列的我国人均GDP分析与预测
基于随机森林算法的飞机发动机故障诊断方法的研究
基于线性散列索引的时间序列查询方法研究
基于组合模型的能源需求预测
基于随机森林算法的B2B客户分级系统的设计