基于时间序列模型的异常话务量分块建模和预测

2019-04-04 01:06范晨邢竟王文静庞朝曦陈伟杰

范晨 邢竟 王文静 庞朝曦 陈伟杰

【摘 要】论文主要研究利用大数据挖掘技术及最优化算法,为实现既保证呼叫中心服务质量的同时,又能保证人力资源最优的配置提供预测数据,供95598坐席排班参考,并通过与实际值的对比进行验证,结果显示该项研究具有较高的推广和应用价值。

【Abstract】The paper mainly studies the use of big data mining technology and optimization algorithm to provide predictive data for the realization of not only guaranteeing the service quality of call center, but also guaranteeing the optimal allocation of human resources. It can provide some reference for the seats scheduling of 95598. Through comparing with the actual value, the results show that the research has high popularization and application value.

【关键词】时间序列;线性回归;话务预测

【Keywords】time series; linear regression; traffic forecast

【中图分类号】TN929.5                                          【文献标志码】A                                            【文章编号】1673-1069(2019)01-0160-02

1 引言

在电改的大环境下,随着人们对电力服务质量的要求不断提高,南方电网已经把提供优质的供电服务提升到了发展战略的新高度[1]。但随着业务类型的不断增加,运营规模的壮大,排班问题变成了日常生产管理者头痛的问题。话务量是呼叫中心进行客服坐席安排的依据,根据不同话务量需求以及固定的坐席数量,安排相应的坐席人员,才能实现既保证呼叫中心服务质量的同时,又能保证人力资源最优的配置。传统的排班模式,需要经验丰富的排班师对话务量进行提前估计,人为主观因素影响比较大、工作量较大,且无法确保话务量预测准确度,无法满足实际生产需求。因此,如何对话务量进行科学准确的预测早已成为一个亟待解決的问题。

话务量是一种随机的、动态的时间序列变化过程,受天气、季节、节假日、电力业务特点等因素的影响,呈现复杂的变化趋势[2]。目前,已有一些预测工具被应用于话务量预测中,比如,自回归移动平均模型、多元线性回归模型、Kalman滤波估计、BP神经网络等,都取得了一定的成果。但所有的模型都是针对常规的话务量进行预测,并未考察和分析异常情况下的话务量预测,在建模过程中只是将话务量异常数据进行剔除或者平滑,并未对异常的话务量数据进行单独建模。

针对以上不足以及话务量自身的特点,我们提出一种基于异常话务量分块建模的分析思路。将话务量分为异常话务量和正常话务量,再根据各自的规律分别建模。最后为了验证模型的有效性,利用相同的方法对总话务量直接建模,以验证异常话务量分开模型的准确性。

2 模型建立

2.1 模型思路

建模的主要思想是通过异常因子相关性建模方法将总话务量分为异常话务量和正常话务量两个部分。并根据各自的发展趋势和规律,建立不同的预测模型,进而得到异常话务量预测值和正常话务量预测值。异常话务量分块建模的基本步骤:首先,找出异常话务量,确定异常因子。从统计分析和建模角度利用多种异常值检验方法、从呼叫中心话单特征角度利用业务探索方法、从外部学习角度利用文献综述法找出引起异常话务量的原因[3]。其次,确定可分析的异常因子。根据影响因子影响力大小、影响因子数据可得性、影响因子是否可预见、影响因子是否存在特定规律等特征筛选出可进行数据分析和建模的话务量影响因子。第三,拆分话务量并分别进行预测。利用相关性分析和建模,从总话务量中分离出异常因子引起的话务量(异常话务量)和正常话务量两类,再分别利用自回归移动平均模型、支持向量机和BP神经网络模型对异常话务量、正常话务量进行分别建模和预测,总话务量预测值=异常话务量+正常话务量。最后,对比验证。

2.2 话务量影响因素分析

从整体来看,可以将话务量影响因素分为以下四大类:一是临时扰动事件。临时扰动因素指的是可以预见但不存在特定规律的事件,比较典型的是不定期的检修活动、临时停电活动、异常恶劣天气等[4]。如果能够预见到类似事件,则一定要预估其作用时间及幅度,并相应的修正话务量。二是特定扰动事件。特定扰动因素是指在可以预见且在一定时间内存在一定规律的异常事件,主要包括以下几类,季度检修引起的计划停电、涉及周末和节假日的特定日期因素、夏季电压负荷相关的特殊时节因素以及自身业务特点相关的电费通知发布、欠费通知发布、停电通知发布、执行停电通知发布等因素。三是临时特定事件。临时特定因素是指不可预见但存在一定规律的异常事件,主要包括以下几类,电网设备衰老、用户计电设备老化、电网运行管理等[5]。四是随机事件。此类事件不可预见也不存在规律,如系统故障、意外故障等随机因素。

根据异常话务量数据分析和建模的要求,按照异常影响因子对话务量的影响程度大小、异常影响因子的数据可得性、数据时间前后统一性等要求,将所有影响因子进行排查,最后确定影响话务量的2类因子:业务特点、异常天气。

利用各类短信通知数与各业务类型每天的话务量做相关分析,找出与短信通知有显著相关的业务类型,将此业务类型的话务量定义为通知类的异常话务量,剩下的业务类型定义为其他话务量。

2.3 模型建立

支持向量机和神经网络建模的基本步骤一样,但其中运用的函数不同[6]。支持向量机是以训练误差作为优化问题的约束条件,以置信范围值最小值作为优化目标。即SVM是一种基于结构风险最小化准则的学习方法,其推广能力明显优于一些传统的学习方法。SVM在解决小样本、非线性及高维模式识别问题中表现出许多特有的优势,并能推广应用到函数拟合等其他机器学习问题中[7]。

3 模型结果

本次话务预测课题研究共分为两个预测小组,两个预测组根据各自的预测方法,分别对2016年11月14日~12月2日连续三周每周的话务量情况进行预测,并将最终的预测结果进行比对,进一步研究下一步的话务工作的优化提升方案。

在为期三周的话务量预测中,经计算得出设计院三周的预测精度平均为12.75%,原排班组预测系统的平均预测精度为34.08%。原排班组预测系统的最低预测误差为1.7%, 最高预测误差为105.41%,而设计院预测最高预测误差为52.09%, 最低预测误差为0.17%。由三周话务预测误差对比可知,设计院的话务量预测较为平稳,波动不是很大,且与真实值更接近。

4 结语

为验证模型有效性,直接利用自回归模型对总话务量进行建模和预测,将预测结果与分块建模预测结果进行对比[8],同时为了验证模型的实用性,与95598呼叫中心的排班组进行为期三周的预测结果对比。实践证明,异常话务量分块建模比传统话务量预测结果精度更好,且异常话务量分块建模为期三周的预测精度均比目前南方电网排班组的预测结果精度更高,未来可进一步落地实现,具有较高的推广和应用价值。

【参考文献】

【1】胡宪华,吴捷. 基于時间序列的移动通信话务预测[D].广州:华南理工大学,2006.

【2】张昊.电力调度自动化系统及电力负荷智能化预测方法的研究[D].广州:华南理工大学,1997.

【3】胡波,李磊.含野值的中长期话务数据分析方法研究[J].武汉水利电力大学学报,2000(6):33.

【4】程伟.基于季节变动模型的话务量预测[J].电信技术,2000(10):25-27.

【5】胡毅,李磊.改进自回归算法在电信话务量预测中的应用[J].计算机工程与应用,2001(3):79-82.

【6】邓聚龙.灰色预测预决策[M].武汉:华中理工大学出版社,1986.

【7】谢开贵,周家启.变权组合预测模型研究[J].系统工程理论与实践,2000(27):7.

【8】任君明.基于数据挖掘技术的移动通信话务预测模型[J].电信工程技术与标准化,2015(6):79-82.