基于回归算法的全量客户消费预警模型

2021-09-01 10:23侯晓晶
数字通信世界 2021年8期
关键词:全量线性语音

张 靖,侯晓晶

(中国移动通信集团山西有限公司朔州分公司,山西 朔州 036002)

0 引言

近几年来,通信行业的外部竞争日益激烈,用户流量大幅提升,但流量单价持续下跌,语音收入持续下降,导致收入增长乏力且变化趋势不容乐观[1]。从竞争环境、“提速降费”等国家政策等宏观层面分析收入变化是一方面,除此之外,我们想要充分发挥我网客户规模处于行业主导地位、客户份额超过60%的优势,结合数据挖掘技术,构建全量客户消费预警模型,将整个收入的变化映射到全量客户的个体变化,实现预测收入目的;并通过监测全量客户的消费行为,圈定重点客户,及时采取针对性措施,打好精细化运营的基础。

1 研究目标

按月提取我网11位手机用户(剔除11位固话、物联网卡用户)的消费、流量、语音、流量收入、语音收入,基于线性回归拟合、二次函数拟合,对每个用户的消费、流量、语音建立线性方程式、二次函数方程式,实现以下目标:一是预测全量客户总收入;二是根据用户消费、流量、语音变化,输出重点客群,辅助营销;三是根据流量单价、语音单价变化,明确增收方向。

2 究流程

主要包括模型构建、收入预测、客群输出流程,以对全量用户的消费进行建模、输出、预测为例。流程图如图1所示。

图1 建模流程图

2.1 模型构建

2.1.1 提取样本

按月提取我网11位手机用户(剔除11位固话、物联网卡用户)的消费、流量、语音数据。

2.1.2 拟合单个用户消费(流量、语音)曲线

2.1.2.1 线性拟合

选择一元线性回归方程进行拟合,将用户的消费(流量、语音)设为因变量y,取时间序列为自变量x,通过最小二乘法[2],按照式(1)求系数a、b,构建一条拟合曲线y=a+bx。

(1)将预测月作为x,代入曲线,即可求出预测月用户的消费(流量、语音)。

(2)通过线性拟合的系数b可以直观反映用户通信行为变化,b>0表示上升,b<0表示下降。

2.1.2.2 二次函数拟合

为提高预测值得精准度,更好地切合用户消费变化曲线,我们选择了拟合度更高的二次函数,进行二次函数构建[3]。将用户的消费(流量、语音)设为因变量y,取时间序列设为自变量x,求取系数a0、a1、a2,构建一条拟合曲线y=a0+a1x+a2x2。

(1)将预测月作为x,代入曲线,即可求出预测月用户的消费(流量、语音)。

(2)求出预测时间点处的切线y=kx+b,其斜率k的正负表示用户消费的升降,斜率k绝对值大小表示用户消费变化的强弱。

2.2 收入预测

(1)原理:根据全量手机用户往前推10个月的月消费数据,构建每个用户的消费(流量、语音)两条拟合曲线:线性拟合y=a+bx、二次拟合y=a0+a1x+a2x2,二次拟合函数的精度高于线性拟合函数,因此以当前月份作为自变量x代入二次拟合函数,可预测用户当前月份的消费(流量、语音)。

(2)示例:2020年7月初,会根据用户2019年9-12月、2020年1-6月分月全量手机用户的消费数据,构建每个用户的消费拟合函数y=a0+a1x+a2x2,先预测每个用户的7月收入,再全量求和,作为7月的手机用户预测收入。

2.3 客群输出

2.3.1 参数分析

线性拟合y=a+bx曲线中的系数b,能够表示用户整个分析区间内的变化走向[4],当b为负值时,表示曲线存在下降趋势,即用户消费(流量、语音)下降,b值越小,下降趋势越明显。当b为正值时,用户消费(流量、语音)平稳或上升,b值越大,上升越明显。二次函数拟合斜率k能够表示用户在预测月附近的变化走向,当k为负值时,表示曲线存在下降趋势,即预测月附近用户消费(流量、语音)下降,k值越小,下降趋势越明显。当k为正值时,预测月附近用户消费(流量、语音)平稳或上升,k值越大,上升越明显。

2.3.2 综合实际数据与参数的分析,总结三类趋势

通过对用户实际消费等数据的变化分析,结合参数的变化,总结出三类趋势:

(1)下降:线性拟合系数b<0,二次函数拟合斜率k<0。

(2)上升:线性拟合系数b>0,二次函数拟合斜率k>0。

(3)趋于平稳:线性拟合系数b、二次函数拟合斜率k正负相反。

表1 三类趋势说明

?

表2 示例用户1-12月消费数据

2.3.3 输出重点客户,辅助分类营销

按照用户的消费、流量、语音三个维度的下降、上升、趋于平稳变化,划分颜色预警,有的放矢开展营销。

(1)红色预警:消费、流量、语音均下降。营销策略:高危客户,通过流量赠送、体验实现业务量维稳,实现业务回流。

(2)黄色预警:消费、流量均下降。营销策略: 不稳定客户,营销中优先考虑,主套餐价值适当下降,以不限量打折活动推动迁转实现客户稳定。

(3)蓝色预警:消费、流量任一下降,或消费、流量趋于平稳。营销策略:较稳定客户,主推资费平移,实现收入保持。

(4)绿色预警:消费、流量、语音均上升。营销策略:稳定客户,坚持价值向上运营原则推不限量,实现收入增长。

2.3.4 辅助决策,明确增收方向

基于曲线回归分析,将1-10月份存量用户的流量单价、流量总量作为样本,绘制变化曲线[5],可看出:一是流量单价处于持续下降状态,且从7月份开始,下降趋势放缓;二是流量总量持续上升,上升幅度较稳定,7、8月明显,10月开始放缓。按照收入=单价×总量计算,绘制流量收入曲线,可看出流量收入持续下降。

通过绘制1-10月份存量用户的语音单价、语音总量分布图,可看出单价、总量两者变化均较平稳,没有明显下降或上升趋势。

由此看出,用户收入的变化,以流量收入的变化为主,因此想要实现收入增长,仍需持续开展流量经营,实现流量爆发式增长,弥补流量单价下降损失,最终达到提升收入的目的。

图2 流量单价、流量总量、流量总收入趋势图

图3 语音总量、语音总收入趋势图

2.4 应用效果

2.4.1 收入预测

模型构建完成后,每月利用该模型进行收入预测、客户分类,辅助市场营销。

每月7号之前,通过模型预测当月存量手机客户收入,2019年5月为收入趋势变化转折点,5月之前, 预测收入趋势均为下降,5月及之后,收入开始维稳回升,2019年11月,收入出现下滑,2020年3月,疫情过后复工复产,收入趋势回升,预测收入变化趋势与真实收入变化趋势基本一致,且相对差距未超过5%。

表3 收入预测数据

2.4.2 分类营销

(1)2019年8月输出本网红色预警客户1.98 万,截止2019年12月底,离网1.13万户,离网率达57.1%,说明该类用户确实属于高危客户。

(2)模型累计输出流量红色预警客户14.7万, 通过引导用户体验业务,3.7万用户流量止跌回升, 挽留成功率25.2%。

(3)存量客户套餐经营是一项持续推进的工作,通过客户预警模型,提前为目标客户附加颜色预警,有效缩小了目标客户规模,平均营销成功率为12.36%。

表4 示例用户1-12月消费数据

3 结束语

以往对于市场收入的趋势分析,是站在宏观角度预测分析,对个体的收入预测属于空白,本论文将全量收入的变化趋势映射到个人,构建全量客户消费预警模型,来指导市场经营。使用PHP语言实现了一元线性回归、一元二次回归两种算法,通过对用户消费、语音、流量数据进行曲线拟合,达到对收入的预测目的,且相对误差控制在5%以下。通过预测个体的消费趋势,圈定重点客户,划分颜色预警,有的放矢制定营销策略,及时采取针对性措施, 打好精细化运营的基础,以定量的模型代替以往通过经验来定性的行为,使市场经营更精准[6]。

猜你喜欢
全量线性语音
线性回归方程的求解与应用
贵州野生小檗属植物土壤与植株微量元素相关性及富集特征
魔力语音
基于MATLAB的语音信号处理
大数据还是小数据?
基于MQ3与MP3的价廉物美的酒驾语音提醒器
271家网货机构公布资金存管信息超八成全量业务上线
对方正在输入……
二阶线性微分方程的解法
非齐次线性微分方程的常数变易法