一种光传送网告警分级预警算法

2016-10-11 03:13醒,张
光通信研究 2016年3期
关键词:全量极差预警

苏 醒,张 璐

(中国移动通信集团广东有限公司东莞分公司,广东东莞 523129)

一种光传送网告警分级预警算法

苏 醒,张 璐

(中国移动通信集团广东有限公司东莞分公司,广东东莞 523129)

被动地维护OTN(光传送网)各网元及其触发的告警已无法满足当前复杂的网络管理需求。文章在OTN网络管理系统上梳理出影响业务的各种重要告警标题,结合业务影响关联分析,提出了一种先于故障处理的OTN告警分级预警算法,为OTN告警分级预警和快速响应调度提供了有效可行的数理统计模型和依据。

光传送网;分级;告警

0 引 言

OTN(光传送网)告警预警是先于OTN故障处理、主动挖掘网络隐患的有效管控机制。随着OTN中各种网元及其触发的告警大量涌现,如何对这些海量告警进行有效分析预判成为网络运行管理急需解决的问题。

本文从客户感知、投诉和网络运行安全等维度梳理出影响业务的OTN中各类重要告警标题,通过运用控制图工具,统计分析各类重要告警突变量的上下波动受控情况,结合业务影响关联分析,提出一种先于故障处理的OTN告警分级预警算法。

1 OTN告警分级预警算法

1.1 工具选择

OTN告警分级预警分析的各类全量告警是在一天内统计的告警量,即某类全量告警每天只计一个累计数据,样本数据无需分组,并期望尽快发现异常并消除异常因素。结合各种控制图工具的适用场景进行分析[1-2],选取X-Rm(单值-移动极差)控制图作为OTN告警分级预警分析工具最为合适。

在X-Rm控制图中,取样本空间[X1,X2,…,Xk],k∈(1~n)。各项主要参数介绍如下[3]:

(2)在单值X的控制图中,CL(控制中心线)、UCL(控制上界限)和LCL(控制下界限)分别为为标准差,E2为常数。

(3)在极差Rs的控制图中,UCL、CL和LCL分别为D4为常数。

1.2 预警阈值

OTN告警分级预警分析中应用控制图的目的是要及时发现告警突变过程中出现的异常,判断异常的原则是出现小概率事件,因此选择X-Rm控制图中2σ为警戒限(即作为失控状态即将来临的一个警示信号),3σ为控制限,4σ为行动限,即以此作为OTN告警分级预警分析中3级预警模型的阈值。

2 算法搭建

本文以与业务影响相关的各类告警量变化情况作为分析对象,通过各类告警量的历史收集数据搭建分级预警算法。主要分为如下4个步骤:

(1)告警梳理

根据客户感知、客户投诉和网络运行安全等维度,在现网告警标题中梳理出OTN传输光缆告警、传输质量告警和传输中断告警等重要告警类型作为本次建模的样本对象,具体如表1所示。

表1 OTN重要告警标题梳理分类

结合各告警标题告警量的疏密程度,选取一年中具有代表性的月份的每日全量告警作为基础分析数据样本,要求样本空间不得小于25个。

析出控制图工具中的各项主要参数,包括各告警标题每日全量告警的单值X及其均值(在单值X控制图中用控制中心线ax表示),相邻每日全量告警量的极差Rs及其均值(在极差Rs控制图中用控制中心线aRs表示),各告警标题每日全量告警样本的UCL和LCL(在单值X控制图中分别用UCLx和LCLx表示),相邻每日全量告警量极差的UCL和LCL(在极差Rs控制图中分别用UCLr和LCLr表示)等。为了使告警数据更接近正态化分布,对原数据取对数进行分析。

(2)算法实现

根据步骤(1)析出各重要参数,关联已知故障现状,剔除已知故障的告警异常突变点,同时采用Dixon检验法剔除离群异常数据,剔除样本中离其他观测值较远的样本值。

以传输光缆告警中“OLT(光线路终端)检测不到预期的光信号”重要告警(即LOS告警)标题为例,取该告警标题28天全量告警量(宗)作为分析样本空间。在X-Rm控制图中,相邻每日全量告警量的极差Rs控制图有异样点(即某天全量告警量为194宗)落在控制限之外,判断极差Rs控制图处于不稳定未受控状态,如图1所示。

图1 未受控状态下极差Rs控制图

通过Dixon检验法判断和关联已知故障现状并剔除异常点(即某天全量告警量为194宗),使得相邻每日全量告警量的极差Rs控制图和每日全量告警的单值X控制图均处于稳定受控状态,即Rs和X的样本值均在上下控制线内,如图2所示。

图2 受控状态控制图

(3)算法关联

极差Rs控制图和单值X控制图均处于受控状态后,将单值X作为全量告警的预警模型。采用2σ警戒限、3σ控制限和4σ行动限分别作为三级、二级、一级预警模型阈值。以OTN各类重要告警标题为例,与业务影响相关的重要告警标题及其分级阈值如表2所示。

表2 OTN各类重要告警标题及其分级预警阈值举例

(4)算法优化

OTN告警分级预警算法是建立在极差Rs控制图和单值X控制图均已受控的前提下的。由于选取的样本空间仅反映了一定时间段内各全量告警的变动范围,当网络全量告警趋势变好后,可优化趋势变好的告警预警阈值。滚动优化机制的触发条件建议如下:(1)告警标题全量告警连续5天递减;(2)告警标题全量告警连续10天在中心线以下;(3)告警标题全量告警连续8天中有7天在2σ警戒限以内。

OTN告警分级预警阈值可在滚动优化机制下做周期性修正。滚动优化机制触发条件可结合网络告警的实际情况而定。

3 OTN告警分级预警闭环管控体系

现有的对传输网络告警分析和操作仅限于各网元出现告警和故障后被动地响应和调度,对于告警量突变引起的警戒值往往根据主观经验拍出,缺乏一套科学合理的数学建模工具。

本文根据控制图统计模型得出了预警阈值,从而建立了OTN各类告警突变的分级别管控机制,包括启动条件、响应人员配备、调度响应机制、处理和闭环管控等。同时通过预警模型的后评估环节,结合关联告警各类失败场景、用户感知(故障、业务),优化预警判断的模型,从而形成网络告警预警闭环管控体系,如图3所示。

图3 OTN各类告警分级预警闭环管控机制流程图

4 结束语

本文在梳理影响业务的OTN各类重要告警标题的基础上,选用控制图工具,统计分析了各类重要告警异常突变量的上下波动受控情况,建立了重要告警分级预警算法和模型,为告警预警和快速响应调度提供了有效可行的数理统计模型和依据。

[1] Saniga E M.Joint Economically Optimal Design of¯X and R Control Charts[J].Management Science,2013,24(4):420-431.

[2] Yeong W C,Khoo M B C,Ou Y,et al.Economic-Statistical Design of the Synthetic¯X Chart with Estimated Process Parameters[J].Quality&Reliability Engineering International,2015,31(5):863-876.

[3] Ghiasabadi A,Noorossana R,Saghaei A.Identifying change point of a non-random pattern on control chart using artificial neural networks[J].The International Journal of Advanced Manufacturing Technology,2013,67(5):1623-1626.

A Graded Early-Warning Algorithm Based Alarms in the Optical Transport Network

SU Xing,ZHANG Lu
(Dongguan Branch,Guangdong Co.,Ltd.,China Mobile Communications Group,Dongguan 523129,China)

At present,passive maintenance of elements and alarms trigged in the Optical Transport Network(OTN)can not meet the requirements of complex network management.In this paper,we propose the graded early-warning algorithm before the fault occurred by sorting out various types of important service-related alarm titles and analyzing the related effects in the OTN management system.The proposed method provides an effective statistical model for early-warning alarm and rapid response scheduling in the OTN.

optical transport network;graded;alarm

TN919.1

A

1005-8788(2016)03-0016-03

10.13756/j.gtxyj.2016.03.006

2016-02-06

苏醒(1982-),男,江苏南京人。高级工程师,硕士研究生,主要研究方向为网络运行支撑管理。

猜你喜欢
全量极差预警
成都市温江区全力推进医保全量数据采集试点工作
厘清概念 领悟意义
法国发布高温预警 严阵以待备战“史上最热周”
二次函数极差的规律与应用
园林有害生物预警与可持续控制
土壤重金属污染调查与评估的误区及其改进方法
机载预警雷达对IFF 的干扰分析
水稻冠层光谱变化特征的土壤重金属全量反演研究
预警个啥
方差中亟待澄清的两个错误观点