上海轨道交通技术防范系统运维平台研究

2021-04-06 04:51
山东交通科技 2021年1期
关键词:信息库运维监控

周 明

(上海申通地铁集团有限公司技术中心,上海 201103)

引言

随着上海轨道交通网络化规模的不断发展,截止2020 年,上海地铁运营里程超过800 km,车站超过500 座,轨道交通分担城市公交总客流的60%左右,而车站技术防范系统设备数量也越来越多,尤其是前端摄像机的数量,全网已经达到数万台之多。全方位的技术防范体系,为地铁的正常运营、地铁设施的保障维护、地铁区域的治安维护起到了重要作用。然而,当前数量庞大的技术防范设备的运维工作都是完全靠人工检测和处理[1],故障的发现主要采取日常巡检、周期检修和用户上报的模式,检修维护周期固定,与设备的实际运行状况不匹配,对使用率较低的设备关注度不足,容易造成设备的过度维修和维修不足等问题。因此,为提高技术防范系统运维工作的效率,保证系统运行的可靠性,提升系统的有效性,继而提高轨道交通运营和公共安全防范能力,建设基于信息化的技术防范运维系统将成为技术防范行业发展的趋势[2-4]。

1 系统架构设计

图1 技术防范运维系统组成

上海轨道交通技术防范系统运维平台由平台层和设备层组成,平台层实现对设备层主要设备的运维管理功能,根据管辖范围的不同,分为网络级技术防范运维平台和线路级技术防范运维平台(根据线路实际情况进行配置)。设备层主要是由各类前端设备组成,根据技术防范系统架构,分为网络级管理单位的技术防范系统设备层、线路控制中心级技术防范系统设备层和车站级技术防范系统设备层。系统组成见图1。

1.1 设备层

设备层包括车站、车辆基地的主要设备、控制中心技术防范系统的主要设备和网络级管理节点的技术防范系统主要设备,包括技术防范系统内的主要设备,如前端设备、网络设备和报警前端设备等。

1.2 平台层

网络级技术防范运维系统对网络级本地及全网各线路车站、中心和车辆基地的技术防范系统的设备进行管理和监测,包含的设备包括运维平台服务器、数据存储服务器及技术防范运维客户端。

运维系统平台服务器负责接入所有被监管设备,建立设备资源列表,并收集设备的状态信息和告警信息。数据存储服务器负责对设备信息、日志信息等进行分类和存储。技术防范运维客户端部署集中指挥中心内,并可根据管理的需要,按照区域划分,部署在维保班组所在地。各条线路本线范围内车站、中心、车辆基地的技术防范系统设备通过线路传输网汇聚到控制中心再上传到网络级平台。根据线路具体情况,可在线路级中心或某个区域管理中心部署线路级/区域级技术防范运维系统平台服务器,对本线/区域范围内技术防范系统的设备进行管理和监测。

2 功能设计

技术防范运维系统管理平台需具备用户管理、设备管理、报表管理、告警管理、日志管理、系统管理和图像资源检测等功能。

2.1 用户管理

用户类型按照职责不同分为:(1)系统管理员:对系统的设备管理,系统配置进行管理,以及负责数据和设备的备份与恢复等。(2)授权管理员:对系统的用户类型身份和授权管理。(3)日志审计员:对系统运行日志、用户登录/登出、操作日志等进行统一安全审计。(4)操作员:对设备状态、告警信息进行相应的查看、确认等操作。

2.2 设备管理

支持SNMP 的设备通过SNMP 协议接入技术防范运维系统,不支持SNMP 协议的设备接入到视频监控平台后转换为SNMP 协议通过相应接口同步至技术防范运维系统。设备录入后,针对不同用户查看需要,选择不同的模式进行分组视图展示,如安装位置、生产厂家、设备类型、安装时间等,对设备进行分类分组并绘制出系统网络拓扑结构。系统应能够显示当前接入设备的性能参数,并以实时方式在拓扑图上展现,见表1(包括但不限于表中内容)。

表1 设备性能参数监测

2.3 报表管理

系统能够按照设备类型、设备型号等不同属性,对系统接入设备进行统计,对故障统计如所属分组、设备总数、在线数、离线数、故障总数、新增故障总数、已处理故障总数、在线率、故障排查率等提供统计,并对统计结果进行报表化和图像化展示。可按照时间段、生产厂家、设备类型等属性分类显示对设备的考评得分分布、考评合格率统计、监控设备考评得分排名等。

2.4 告警管理

系统需要能够实时展示接入设备的告警信息。系统应为各种告警消息定义告警级别,用户可根据需要提高或降低某些告警的告警级别,对于特定用户不需要管理的设备或告警类型,需提供白名单过滤设置。系统操作员看到新产生告警后需进行确认操作,表明该条告警信息已被操作人员观察到。针对历史告警日志,可按照告警设备、设备类型、安装区域或生产厂家等不同查询条件进行查询,并以Excel 方式导出。

2.5 日志管理

系统能够记录用户日志,记录操作包括:登录、退出系统、操作用户、操作时间、操作内容、操作结果等;系统内的所有用户增加、删除和修改操作。

2.6 系统管理

系统管理为技术防范运维系统自身的管理,包括版本升级、镜像导入、导出和系统自动备份功能。

2.7 图像资源检测

系统需具备对实时图像和历史录像进行检测,并针对异常进行故障告警的能力。实时图像视频检测功能包括:视频模糊检测、视频过亮、视频过暗、噪声、图像遮挡、图像偏色、视频丢失、云台偏离、云台不可控。历史录像检测功能包括:录像丢失和录像无法播放,包括录像文件损坏、磁盘坏道等原因导致的录像文件可以被检索到,但无法正常回放的情况。

3 系统接口

系统接口涉及技术防范运维系统与被管设备、运维系统与视频监控系统网管、智能安防箱网管等之间的接口。视频监控平台间通过SIP 协议进行级联,视频前端和监控平台通过Onvif 协议通信,见图2。

图2 系统接口

技术防范运维系统通过SNMP 协议管理监控平台及视频前端,监控平台和视频前端都作为设备接入技术防范运维系统。为了保证监控平台管理设备能够和技术防范运维系统中管理设备对应起来,监控平台和前端需要采用监控平台分配的唯一ID 注册技术防范运维系统。

3.1 设备录入

技术防范运维系统被管设备包括:(1)监控平台管理的设备,包括监控平台和视频前端;(2)非监控平台管理的设备,包括网络设备、告警设备、存储设备等。

3.1.1 监控平台管理网元录入

监控平台管理的设备,包括视频前端设备和平台自身,在监控系统中都有唯一国标ID 标识,对于这类平台已经管理的设备,在技术防范运维系统中录入时,要求把平台分配唯一ID 录入到技术防范运维系统中,通过唯一ID 能够找到监控平台设备在技术防范运维系统中的对应关系。

3.1.2 非监控平台管理设备录入

这类设备技术防范运维系统提供录入页面,可手动或批量进行录入。

3.2 设备注册

3.2.1 监控平台设备注册

对于监控平台管理设备,如前端、平台服务,这类设备在注册时,需要通过trap 定时上报设备注册平台的唯一ID,即定时registerTrap trap 到技术防范运维系统。被管设备SNMP 代理需要定时发送csnRegisterTrap,周期默认为30 s(可调)。该trap不仅作为注册使用,同时在注册成功后,可作为心跳和技术防范运维系统之间保活[5]。

3.2.2 非监控平台管理类设备注册

对于非监控平台管理设备,如存储、网络设备[6],这类设备作为设备接入技术防范运维系统,需要在技术防范运维系统手动进行入网,IP 地址作为唯一标识,通过SNMP 协议接入技术防范运维系统。这类设备不会主动注册设备,由技术防范运维系统主动进行连接。

3.3 管理协议

运维管理功能的实现基于SNMP[7],被管设备SNMP 代理模块和系统管理服务单元通过SNMP 协议交互请求和应答,见图 3。

图3 运维系统管理协议示例

被管设备应支持SNMP V3 及以上版本。应答错误码应符合RFC3416 中关于PDU error-status 定义,对于error-status 中未定义错误类型,统一回复errorstatus 中的genErr(5)。

3.4 管理信息库

系统被管设备SNMP 代理MIB 分为6 个组:设备通用信息库(commonMIB)、设备信息库(ipcMIB IPC)、解码器信息库(decoderMIB)、平台设备信息库(platformMIB)、存储磁阵信息库(diskArrayMIB)和智能安防箱信息库(intelligentboxMIB)。

图4 运维系统MIB 接口

车站/车辆基地、线路级和网络级被监管设备与技术防范系统运维平台间通过通用接口A.1(设备通用信息库)、平台接口A.2(平台信息库)和设备接口A.3(设备信息库、解码器信息库、存储磁阵信息库和智能安防箱信息库)上传信息,见图4。根据运维需要,在线路中心或区域中心部署了线路级、区域级运维平台,运维平台的上下级之间通过WebService 交互,见图4 中虚线框所示。

3.4.1 设备通用信息库(STMETRO-StmCommon-MIB)

通用信息库[8]定义了被管设备通用信息。(1)commonObjects 组定义了被管设备的通用系统信息,包括系统信息、网管信息、账号信息、性能信息和设备硬件信息等。(2)commonNotifications 定义了被管监控设备需要主动通知技术防范运维系统的Trap信息。(3)commonOperations 组定义了设备的通用操作,包括重启、升级、恢复出厂功能。(4)除通用信息库定义的内容外,被管设备代理还需实现RFC1213-MIB[9]内的系统信息、接口信息、路由信息和RFC2790[10]内的系统信息、内存信息、磁盘分区信息、CPU 信息。csId 为监控平台类设备为必填项,为设备在监控平台中的国标ID。csSoftwareVersion 为设备软件版本,必填项,技术防范运维系统会使用该值对设备版本进行过滤,在设备升级时使用。

设备需要采用HTTP 或FTP 方式进行版本升级。技术防范运维系统提供文件服务器。用户手动上传升级版本到文件服务器。升级策略由设备自行定义,技术防范运维系统把升级包路径、用户名、密码设置到设备,设备根据自身策略,进行升级操作,升级状态,通过MIB 获取。

3.4.2 IPCMIB (STMETRO-StmIpc-MIB)

IPC 设备信息库定义了IPC 设备管理信息。ipcObjects 组定义了告警联动设置信息(ipcRecording)、设备IO 设置信息(ipcDeviceio)、设备注册监控平台信息(ipcPlatform)等信息。

3.4.3 解码器信息MIB(STMETRO-StmDecoder-MIB)

解码器信息库定义了解码器设备管理信息。

3.4.4 平台MIB (STMETRO-StmPlatform-MIB)

平台设备信息库定义了监控平台类设备/服务管理信息。platformObjects 组下定义了平台上运行服务信息(service)、上下级平台信息(platform)、平台已入网前端设备信息(device)等。

3.4.5 存储设备信息MIB (STMETRO-StmDiskArray-MIB)

存储设备信息库定义了存储类设备管理信息。

3.4.6 智能安防箱信息MIB(STMETRO-StmIntelligentbox-MIB)

智能安防箱信息库定义了智能安防箱设备管理信息。

3.5 平台级联协议

3.5.1 运维平台级联

运维平台之间采用WebService 协议进行级联。运维平台之间功能包括:注册、下级运维平台列表上报、运维平台之间心跳保活、下级运维平台定期数据上报等。运维平台负责管理本级平台接入网元状态、告警等功能,对于下级运维平台,上级运维平台负责收集下级运维平台的定时统计数据(按天、周、月统计的数据),并提供报表统计功能。

3.5.2 运维平台属性定义

运维平台采用唯一32 位UUID 进行编码,保证唯一性。级联运维平台之间为父子关系,运维平台列表上报时,携带ParentID 表示上下级关系,没有上级,ParentID 为空。

4 建设方案

在上海轨道交通中新线建设和既有线路改造时可按以下方案进行工程建设技术防范运维系统。

4.1 网络级技术防范运维平台建设方案

网络级技术防范运维平台建议部署在集中指挥中心,包括运维平台服务器和数据存储服务器,用于对集中指挥中心本地技术防范系统设备进行运维管理,对全网各线路技术防范运维平台上传的结果进行汇聚、展示和保存,见图5。

图5 网络级技术防范运维平台建设方案

建议在集中指挥中心节点和维保班组所在地部署技术防范运维平台工作站及客户端。区域级运维平台,根据维护管理需要,择地进行配置。

4.2 新线建设方案

对于采用高清系统的新线,本线范围内车站、中心、车辆基地的技术防范系统设备通过线路传输网汇聚到控制中心再上传到网络级平台。可在线路级中心部署线路级技术防范运维平台,负责对本线OCC 及各车站技术防范系统设备运维管理,并将收集到的数据及统计结果上传至网络级运维平台,见图6。

图6 线路级技术防范运维平台新线建设方案

对于延伸段采用高清视频监控系统,既有段采用标清视频监控系统的线路,建议在延伸段建设时将延伸段技术防范系统设备通过线路传输网汇聚到线路中心后接入到网络级线路级平台,由网络级平台进行统一运维管理,既有段待更新改造到数字高清制式后再进行接入。

4.3 既有线改造方案

对于采用模拟视频监控系统的既有线,建议待系统更新改造到数字高清制式后按照采用高清系统的新线建设方案建设。对于重要设备,可以先采用在既有线OCC 设置网关的形式,将既有线的部分设备上传至网络级运维平台内,见图7。

图7 既有线技术防范系统接入方案

5 结语

针对上海轨道交通技术防范系统的发展现状,以建设系统运维能力、保障技术防范有效性、提升安全防范能力为目标,结合SNMP简单网络协议技术,研究上海轨道交通技术防范系统运维平台系统架构及接入协议,对上海轨道交通技术防范系统设备及平台软件提出标准化探讨,并将基于SNMP 的设备运维技术在上海轨道交通通信、信号等系统的使用进行了试验和验证。

猜你喜欢
信息库运维监控
高速公路智能运维平台
The Great Barrier Reef shows coral comeback
运维技术研发决策中ITSS运维成熟度模型应用初探
你被监控了吗?
借助BIM构建动态造价信息库的新思路
基于普元EOS平台的信息库的设计与实现
配电线路的运维管理探讨
基于一体化的变电标准运维模式
科学训练监控新趋势——适时监控
提高体育教师教学监控力的有效途径