ATM交易状态特征分析与异常检测

2019-09-10 07:22吴越张林翔陈玉兰蒋伟
信息技术时代·上旬刊 2019年2期
关键词:方差分析相关性分析

吴越 张林翔 陈玉兰 蒋伟

摘要:针对ATM交易系统产生的交易数据,对交易时刻、交易量、交易成功率和响应时间进行person相关性分析,提取ATM应用系统的交易状态特征参数。对时刻-交易量进行方差分析并利用3σ準则提取异常点,对成功率-响应时间引入K-means聚类对异常点进行分级。由此找出交易量、交易成功率和响应时间的异常值,进而建立ATM 异常检测系统。

关键词:相关性分析;方差分析;K-means聚类

引言

ATM提供提款、存款、转账等银行柜台服务,提升了银行的工作效率,给群众带来了很大的便利。但随着商业银行 ATM 业务的快速发展,银行承担的确保 ATM 交易系统稳定运行的压力越来越大,ATM的维护管理和数据安全显得十分重要,交易系统的性能管理成为一大关键问题。

因此,ATM交易状态的故障发现与异常数据检测成为我们的研究问题。本文的主要研究内容是根据汇总信息包含的四个指标(交易时刻,交易量,交易成功率,交易响应时间),选择、提取、分析ATM 交易状态的特征参数,并设计一套交易状态异常检测方案,以实现故障场景的正确判断与及时报警。

1 数据来源与处理

1.1 数据来源

本文数据采用 2017 年“深圳杯”数学建模挑战赛提供的从1月23日至4月23日某商业银行 ATM 应用系统某分行的交易统计数据。

1.2 数据预处理

首先对每分钟对各分行的交易信息进行汇总统计,包括交易时刻,交易量、交易成功率、交易响应时间 4个指标。其次对所给数据进行了缺失填补,并去除不符合实际的数据。

(1)数据分段处理

首先根据数据做出累计交易量与日期之间的关系,发现1月23日至1月27日,由于春节前夕导致ATM交易量明显增长。1月28至2月5日,由于处在春节期间,银行的日均累计交易量明显低于平时。而其余时间段的累计日交易量波动范围较小、较平稳,具有研究价值。因此本文主要对2月5日后的数据进行交易状态特征分析。

(2)工作日与非工作日比较

根据数据分别绘制非工作日与工作日的时刻-交易量的关系,观察发现交易量与时刻的图像呈“双峰型”分布。交易量在0-420 min处于较低水平,420-1260处于较高水平。根据实际情况分析,即在0:00-7:00时刻,由于夜间人流量少,故导致交易量较低。而在7:00-21:00时,该时间段为工作阶段,人们活动量大,故交易量持续稳定的处于较高水平。

分析比较工作日与非工作日,发现工作日与非工作日的每一时刻交易量相差小,仅在某个高峰段的存在微小差异。从整体上看,工作日和非工作日的单日交易量不存在明显差别,因此本文不对工作日与非工作日的数据进行区分。

2 交易状态相关指标分析

对日期、时刻、交易量、成功率和响应时间进行Pearson相关性分析,进行初步的数据相关性观察,为下一步提取特征参数做准备。利用SPSS,得出4个变量间的相关性:

1)交易量与时刻存在正相关;

2)成功率与响应时间存在负相关。即数据中心后端系统处理异常,导致交易失败则响应时间加长。

3 交易状态异常检测方案

3.1交易量的聚类分析

由于春节后每天各时刻的交易量与平均值有较大的差异,求出每天的交易量平均值与各时刻的关系,观察表明春节后每天各时刻的交易量与均值的差异近似服从正态分布,因此我们利用方差分析法,将差值较大的交易量定义为异常值。并引入 准则,将 作为其置信区间,从而判断并提取异常点,通过以 为置信区间,将每天交易量与均值的差值在 之外的值标记为异常点,

即可对交易是否出现异常进行检测。根据某一时刻算出理交易量,此时对应时刻的实际交易量若在置信区间内,则交易正常。否则,交易异常。

3.2基于K-means聚类分析的成功率和响应时间异常检测

根据汇总成功率-响应时间的数据,通过SPSS,对三月份的成功率-响应时间的数据进行K-means聚类处理,可得三类聚类中心,如图1

根据聚类结果,三类聚类中心分别为(0.83,142.95)(0.95,12288.29)(0.41,79947.34)。我们将这三类异常程度定义为 “稳定”“临界异常”“异常”3个程度。分析最终的聚类结果,则可判断出第一类红色区域的点为代表交易处于临界异常,第二类绿色区域表示交易异常状态,成功率低且响应时间长。第三类蓝色区域成功率较高且响应时间低,为正常点集中区域。

4 结论

本文首先对 ATM应用系统的交易状态特征参数进行提取,探讨ATM交易各指标之间的关联性。进而建立了ATM交易状态异常检测模型。基于方差分析法以及 准则,能够有效的找出交易量异常点。利用k-means 聚类分析可区分出数据交易成功率和响应时间异常点并对异常程度进行分级。本文设计的一套交易状态异常监测方案,能尽可能实现对ATM交易系统异常的及时报警,减少虚警误报,使ATM 交易系统的性能管理问题有了一定的突破。从而提高银行自动系统的工作效率,保障系统的畅通,便利ATM的使用者,使得ATM的服务便利性发挥到最大。

参考文献

[1]孙博,康锐,张叔农.基于特征参数趋势进化的故障诊断和预测方法[J].航空动力学报,2008(02):393-398.

[2]杨志浩.聚类分析算法研究改进及其在ATM选址中的应用[D].鞍山:辽宁科技大学,2014.

[3]丁智国.流数据在线异常检测方法研究[D].上海大学 ,2015

[4]李一,蔡礼渊.ATM交易状态特征分析与异常检验[J].成都工业学院学报,2018.21(1).

作者简介:吴越(1998-),福建人,本科生;

蒋伟(1982-),重庆人,副教授,研究方向:数学建模与图像处理。

猜你喜欢
方差分析相关性分析
Excel在《生物统计学》双因素有重复方差分析中的应用与探讨
滨州市城区苔藓植物主要重金属含量的调查与分析
上市公司财务指标与股票价格的相关性实证分析
淘宝星店成长中的粉丝力量
中国城市化与经济发展水平关系研究
高校二手书市场细分研究
应用统计学课堂教学组织实践与探索
金华市大学生幸福感调查研究
“互联网+”时代的出租车资源配置