基于BP神经网络的ATM故障预测

2018-08-20 19:01崔四帅王子伟
科学与财富 2018年19期
关键词:特征参数成功率阈值

崔四帅 王子伟

摘 要:当前,随着社会经济和人们生活质量水平的提高,自助服务设备已经成为银行为持卡人提供金融服务的重要渠道。随着ATM的网络规模和复杂性的日益增加,如今银行都面临着如何管理ATM机的巨大挑战。本案例考察对大数据的处理与分析能力,对于问题我们先利用Excel的函数功能,对数据进行了简单的数理统计。再利用SPSS软件,对数据的内在关系进行分析,用3σ原则选取了两个特征参数来判定ATM机的工作状态。经过分析,ATM机工作状态的特征参数之间具有复杂的非线性特征,所以我们采用BP神经网络对ATM机故障进行预测诊断。

关键词:数理统计 3 原则 B P神经网络

一、问题重述

通过大数据的分析来提取出可利用、分析的数据点,并提出了以下问题:

1.选择,提取和分析ATM交易状态的特征参数;

2.设计一套交易状态异常检测方案,在对该交易系统的应用可用性异常情况下做到及时报警,同时减少虚警误报;

二、问题分析

2.1 问题1的分析

案例中,问题主要考察对大量数据的处理能力和统计数据的分析能力,要既能掌握整体,也要认清局部。由于数据(样本)多(约13万),以及初步对数据的观测,我们大胆假设业务量与交易响应时间是连续变化的且都服从于正态分布,呈正态分布状。我们选用Excel表格和SPSS软件来进行对问题一的处理,以选择、分析出特征参数。

2.2 问题2的分析

案例中,问题主要考察的是对数学模型的构建。要在问题1所找到的特征参数的基础上,设计,建立能够侦测出故障点并报警的一套异常报警方案。同时,我们还必须找到能够减少误报的途径,并在我们的数学模型中有所体现,以求做到约束作用,起到减少误报的目的。我们选用MATLAB来完成对数学模型的建立。

三、模型的建立与求解

3.1 问题一的解答

3.1.1 对于交易量以及交易响应时间分析方法的确定

首先,我们运用SPSS对画出数据的分布图,以找出其服从的分布函数。从图中可以看出交易量 与交易响应时间Y 是近似符合正态分布的,即对于每一个样本点x1 ,x2 ,……,xn 或都是取自总体或这样的正态分布中。

经查阅资料可知[1],生产上,通常控制图是根据“3 原则”来决定上下控制界限,其广泛的应用在质量检测,产品检验与质量控制等诸多领域。那么,我们可以利用“3σ 原则”,初步将μ+3σ 作为阈值来进行对数据的分析与筛选。

3.1.2 在“3 原则”下对数据的分析与处理

利用Excel中的插入函数功能,我们计算出所需的数值。(阈值为μ+3σ)

然后,先对交易量利用阈值进行筛选。我们发现,在以交易量的阈值作为筛选条件时(认为交易量大于阈值时,系统出现故障),只有一月的数据被筛选出来存在这样的“坏值点”。

我们发现数据在时间上的连续性很好,且有些“坏值点”的成功率低于平均成功率很多(如标注出的成功率)。但是,依旧存在着少量时间上的间断点

最终,我们分析认为:

1.对于交易响应时间利用“3σ 原则”作为它的控制界限,来找出坏值点的方法是可行的,符合了我们对于故障在时间上是连续的假设;

2.对于交易响应时间长而成功率高的点,其在时间上基本是间断的,或者持续时间很短,我们把这些点当做正常點来处理。

3.注意到仍存在成功率很高但也被认为是坏值点的问题,我们提出要对交易成功率也确定一个阈值,在双重阈值之下对数据进行筛选;

3.2 问题二的解答

首先,利用SPSS软件分析业务量和交易响应时间与交易成功率的关系

但我们研究发现,交易成功率与交易响应时间存在很复杂的非线性关系,很难找出拟合度较好的数学表达式,针对这样的复杂性,我们决定,准备采用BP神经网络建立一套侦测交易状态数据异常的数学模型,于是我们建立了以下模型:

第一步:利用Excel的随机函数我们取用了大量的正常点与坏值点,作为训练样本(原始数据),最终我们选取的正常点与坏值点,这组数据的覆盖性广且具有代表性,因此满足该问题的要求:

第二步:初始化各种学习参数,具体数据如下:最大训练次数:50000;隐含层(中间层)神经元数量:12;网络学习速度(速率):0.05。

第三步:借于以上选的的数据和参数进行网络学习。

结果分析:如图所示本次学习结果陷入了局部最优状态无论经过后续多少次的学习,精度都成一条直线无法达到所设定的要求,而且当把未参与训练的数据作为仿真预测数据输入校验是,效果极差,不具备预测能力。因此我们必须修改参数继续进行网络学习,接着以该网络多次学习,并且多次调整隐层节点数,取值范围为10~20,,结果发现在隐层节点数取值12时,达到训练精度,

结果分析:改进后的网络学习次数明显减少只需4步就能达到问题所需的精度要求,这样我们可以速度快,精度高的预测ATM机的故障。

第四步:经过以上三步的对网络学习和改进,最终我们达到了速度快,精度高的预测要求,如果需要对将来某时刻的ATM机故障预测,只需要将该时刻具体的二维特征数据作为输入变量,用此模型进行预测即可得到相应的预测结果。

四、结果的分析与检验

对于模型的检验,我们随机挑选了8组数据进行故障检测 可以看出,该模型很好的检验到了故障点(坏值点),并且也避免了将单独的一个离散的时间点作为故障(如模型的建立中所提到的:响应时间长,但是成功率高且时间上离散的点),很符合实际情况。这样,这套利用BP神经网络的数学模型实现了以问题一为基础,ATM机出现故障时的报警,并明显的减少了虚报的情况。

4.1 模型的推广

近年来,人工神经网络以其独特的结构和处理信息的方法,在许多实际应用领域中取得显著的成效,解决了一些极难求解的问题。人工神经网络的突出特点之一是它的预测功能强大。该神经网络预测模型还可以广泛应用于对股票市场的预测,交通流量预测,医学病症预测,商品销量预测,电子设备质量检测等诸多领域。

参考文献:

[1] 周俊林,基于数据挖掘的分布式异常检测,电子科技大学大学博士论文,2010。

[2] 卓金武,MATLAB在数学建模中的应用(第2版),北京:北京航空航天大学出版社,2015,134-141。

[3] 朱凯等,精通MATLAB神经网络,北京:电子工业出版社,2010,375-392。

猜你喜欢
特征参数成功率阈值
成功率超70%!一张冬棚赚40万~50万元,罗氏沼虾今年将有多火?
故障诊断中信号特征参数择取方法
基于特征参数化的木工CAD/CAM系统
如何提高试管婴儿成功率
小波阈值去噪在深小孔钻削声发射信号处理中的应用
基于自适应阈值和连通域的隧道裂缝提取
如何提高试管婴儿成功率
基于PSO-VMD的齿轮特征参数提取方法研究
比值遥感蚀变信息提取及阈值确定(插图)
室内表面平均氡析出率阈值探讨