铁路综合视频监控系统故障定位研究

2020-08-15 13:30杨栩
现代信息科技 2020年7期
关键词:故障树

摘  要:文章结合铁路综合视频监控业务特点,梳理出构成无实时视频和录像断点两类典型故障的基本底层事件源,分别建立了故障树并求出最小割集。通过结构重要度分析法分析最小割集中的底层事件源的重要度,做出定性与定量分析,得到底层事件源的结构重要度排序序列,对视频监控系统的两类典型故障告警提出筛选方法,该方法提高了运维故障定位速度,提高了系统的安全性和可靠性。

关键词:铁路综合视频监控;故障树;二元决策图;结构重要度

中图分类号:TP277;TP391.4      文献标识码:A 文章编号:2096-4706(2020)07-0042-03

Study on Fault Location of Railway Integrated Video Monitoring System

YANG Xu

(CRSC Communication & Information Corporation Co.,Ltd. Security Technology Branch,Beijing  100070,China)

Abstract:Based on the characteristics of railway integrated video monitoring service,this paper sorted out the basic underlying event sources that constituted two types of typical faults without real-time video and video breakpoint,respectively established the fault tree and figured out the minimum cut set. Minimum cut set through the analysis of the structure importance degree analysis of the underlying event source to the important degree of qualitative and quantitative analysis,get the underlying event source of collating sequence structure important degree,the video monitoring system of two kinds of typical fault alarm filtering method is proposed,the method improves the operational speed of fault location,improve the security and reliability of the system.

Keywords:railway integrated video monitoring;fault tree;binary decision graph;structural importance

0  引  言

鐵路综合视频监控系统是根据铁路行车指挥、生产组织、客货运输服务、作业监控、抢险救援以及治安防范等需要,应用音视频监控、通信、计算机网络等技术,构建的具有音视频数据采集、传输、交换、控制、显示、存储、处理功能的监控系统[1]。随着该系统在国内大规模建设使用,作为保障铁路运输安全与提高工作效率的重要技术手段,监控系统中的硬件设备以及软件平台需要保证全天候、高质量运行,以确保铁路调度指挥人员和安全警务人员通过系统及时了解辖区和线路动态状况,尤其是车站、桥梁、路基、维修通道等重点部位和设备的实时情况,并为快速处置突发事件提供技术保障。

2020年初,中国国家铁路集团有限公司提出了构建新型智能运维管理体系的总体要求和“网络智能运行、资源智能管理、系统智能维护、业务智能应用”的发展目标。铁路用户对不断创新铁路通信运维管理体系,构建综合监测平台,以网管状态监测数据为指导,推行通信网络预防性状态修复,增强视频监控业务系统运行状态监测能力等方面的需求愈发强烈。鉴于此,通号通信信息集团有限公司结合既有铁路综合视频监控系统的业务特点,研发了视频专业自动化运维平台,本文阐述了该运维平台对故障定位的具体处理方法。由于视频监控系统日常运行中会产生大量的故障告警消息,如何在告警风暴时压缩告警,快速从大量告警中找到故障根源是提高运维工作效率的关键。本文通过二次决策图构建并分析故障树,将各种故障类型之间的故障因果关联,找到故障源的最小割集,计算形成结构重要度序列和完善告警收敛机制,帮助运维人员从海量故障告警中筛选出造成故障的根本原因,达到快速智能化运维效果。

1  故障事件分类梳理

视频监控系统存在两种典型故障类型。第一类故障:无法获取实时视频图像故障。第二类故障:录像断点故障。录像出现断点时段内是否存在摄像机离线、服务离线、云存储异常等告警,进一步分析路线断点的根本原因是哪类故障造成的。

我们对这两类故障的根因故障源分别逐级梳理,得到更详细的故障事件表,如表1、表2所示。

2  故障树的创建与分析

2.1  创建故障树

故障树模型是描述对象结构、功能和关系的一种定性因果模型,它体现了故障传播的层次性和子节点(即下层故障源)与父节点(即上层故障现象)之间的因果关系[2]。

在创建无实时视频故障树之前,我们先对故障判定机制进行推演,当出现故障时,网络连通性成为首要监测的目标,先要判断交换机、摄像机以及与摄像机关联的分发接入服务之间的网络连接是否畅通;其次,判断摄像机自身的电源是否工作正常、内部应用程序是否正常;最后,判断视频分发服务VSS和视频接入服务VAG两个应用服务程序的运行状态是否正常。得到无实时视频故障树,如图1所示。

同理,在创建录像断点故障树之前,我们对录像断点故障判定机制进行推演。首先,判断交换机、摄像机以及与摄像机关联的分发接入存储服务之间的网络连接是否畅通;其次,当网络正常同时摄像机自身电源工作正常时,需要进一步判断存储介质工作状态是否正常(例如,云存储集群的工作状态是否正常、磁盘是否损坏、磁盘是否被拔出、磁盘读写是否异常、磁盘的逻辑分区存储是否剩余空间不足);最后,再验证SMS存储应用服务程序进行的运行状态是否正常。得到录像断点故障树,如图2所示。

2.2  事件重要度分析

2.2.1  定性分析

事件的重要度是指一个事件发生故障时,对其顶事件发生概率的影响程度,是一个系统中各部分或子系统重要程度的一种数量衡量方式。事件重要度一般分为三种:结构重要度、概率重要度和临界值重要度。结构重要度是部件在系统中所处位置的重要程度,结构重要度与部件本身故障概率无关,仅与该部件在系统中所处的位置有关[3]。本文采用结构重要度来度量计算故障源的重要程度,以便按照结构重要度顺序安排防护措施。对于视频监控系统来说,无实时视频和录像丢失这两种典型故障是符合结构重要度分析的前提条件的,本文采用结构重要度分析法,分析两种故障对应的基本底层故障源的重要度大小,并给出排序序列,进而保留重要度较大的因素,去掉重要度较小的因素,达到告警收敛过滤的目的。

最小割集是导致顶上时间发生的基本事件的组合,通过求解最小割集可以定性地研究系统发生事故的原因和危险性[4]。

通过图1可得,无实时视频故障树的最小割集有8个,

即:K1={X2}、K2={X1,X3}、K3={X3,X5}、K4={X1,X4}、K5={X4,X5}、K6={X6}、K7={X7}、K8={X8,X9}。

通过图2可得,录像断点故障树的最小割集有9个,即:K1={Y2}、K2={Y1,Y3}、K3={Y3,Y5}、K4={Y1,Y4}、K5={Y4,Y5}、K6={Y6}、K7={Y7}、K8={Y8,Y9,Y10}、K9={Y11}。

通过定性分析规则我们得到以下两个结构重要度序列,无实时视频故障源的结构重要度序列A:{I(1)=I(2)=I(3)=I(4)=I(5)=I(6)=I(7)>I(8)=I(9)};无录像故障源的结构重要度序列为B:{I(1)=I(2)=I(3)=I(4)=I(5)=I(6)=I(9)>I(7)=I(8)=I(10)}。

2.2.2  定量分析

定量分析近似计算公式如下[5]:

I(i)=

式中:I(i)——第i个基本事件的结构重要度系数;

Kj——第j个最小割集;

nj——第i个基本事件所在的第Kj最小割集中的

基本事件总数;

xi——第i个基本事件。

经过计算得到无实时视频故障源的结构重要度序列C:{I(1)=I(2)=I(3)=I(4)=I(5)=I(6)=I(7)>I(8)=I(9)};无录像故障源的结构重要度序列为D:{I(1)=I(2)=I(3)=I(4)=I(5)=I(6)=I(9)>I(7)=I(8)=I(10)}。

可见,定性分析与定量分析得到的结构重要度序列是一致的,在实际应用中,当出现多个底事件同时产生告警时,可依据重要度序列,保留重要程度高的告警,过滤掉重要度较低的告警,达到告警收敛的目的。

3  结  论

通过故障树分析法对铁路综合视频监控系统故障进行分析,并建立故障树,通过结构重要度方法计算得出各底事件的结构重要度,比较重要度大小可以快速定位故障。当然该方法在创建故障树的时候因人而异,一般很难实现统一化标准化,会存在对常见故障和多发故障症状和原因列举过多,而对于少数故障和特殊故障症状和原因列举不足的缺陷。在实践过程中,我们也关注到了贝叶斯网络算法作为一种强有力的不确定性的知识表达与推理模型,已经应用于诸多故障诊断领域。在未来的研究中,可以考虑把故障树法与贝叶斯网络算法结合起来作为一种研究方向来提升故障定位的全面性,弥补单独依靠故障树法产生的缺陷。

参考文献:

[1] 中国铁路总公司.铁路综合视频监控系统技术规范:Q/CR 575-2017 [S].北京:中国铁道出版社,2017.

[2] 徐志胜.安全系统工程 [M].北京:机械工業出版社,2007.

[3] 于捷,孙立大,石耀霖,等.基于BDD技术的数控机床故障树重要度分析 [J].机床与液压,2008,36(12):186-189.

[4] 陈文伟,周玲.基于安全系统工程的地铁投资控制分析 [J].湘潭师范学院学报(自然科学版),2004(3):123-125.

[5] SINNAMON R M,Andrews J D.New approaches to evaluating fault trees [J].Reliability Engineering & System Safety,1997,58(2):89-96.

作者简介:杨栩(1978—),男,汉族,天津人,高级工程师,硕士,研究方向:自动化运维。

猜你喜欢
故障树
故障树计算机辅助分析优化算法研究与应用
某型发动机喘振故障的研究
数控机床液压系统故障诊断专家系统的研究
系统安全性分析技术在空空导弹中的应用
民用飞机强度试验故障处理流程研究
基于故障树的中专电梯维修教学研究
基于故障树的大型设备机组故障诊断研究
民用飞机安全性分析研究
紧急制动控制电路安全性分析
基于故障树的工程作业船与海上平台碰撞风险评价模型