推进集中故障管理 提升网络生产效率

2014-11-26 14:29矫秀梅
科技与创新 2014年20期
关键词:应用效果

矫秀梅

摘 要:随着TD、WLAN、有线网络的快速发展,网络维护范围从原有网络设备拓展到客户侧、内容源设备。大量增加的新网元没有按照集中化的要求管理,原先适用于2G网络的运维模式和理念已经无法满足“面向客户、面向端到端业务管理”的要求。面临变革的需求,要从更高层面和更大范围思考并建立适应全业务发展的运维管理新体系。在这一背景下,移动集团公司制定了集中故障管理的新目标,即大力推动网络监控集中化,以省为单位集中管理、集中监控、集中维护,逐步取消地市公司监控值班,简化工作流程,提升工作效率。以吉林移动分公司集中化故障管理为例,阐述了集中化的目标、实现集中故障管理的措施和集中故障管理的应用效果。

关键词:集中化;故障管理;网络生产效率;应用效果

中图分类号:TP393.06 文献标识码:A 文章编号:2095-6835(2014)20-0137-02

1 集中故障管理的总体目标

集中故障管理改革的总体目标为:取消地市监控和代维调度,故障直派一线班组。总体流程和职责分工由原来的省、市二级监控转变为省级一点监控,即地市公司、县公司、代维厂家不再承担监控和故障调度的职责,从根本上实现了运维流程的标准化、扁平化、透明化和精细化,提升了网络生产效率。

2 实现集中故障管理的措施

2.1 派单新模式

以“区域+设备类型+告警名称”为判断标准的故障工单派单新模式。在集中故障管理体系下,将故障预处理分为人工预处理和自动预处理,原有的按网络层级和网络类型派单的模式无法满足这一需求。集中化项目组提出了具有创新性的派单新模式,顺利地解决了这一问题。从全网故障情况来看,以“区域+设备类型+告警名称”为判断标准的故障工单派单新模式有效地缩短了故障历时时间。

2.2 设定关联规则

跨专业告警关联新规则,提升工单关联性和告警派单比。为了支撑集中故障管理工作,有效压缩了各专业告警派单量,精准定位故障工单,项目组组织各专业技术骨干对传输、无线、动环3个专业共6大跨专业故障场景设定了关联规则。

2.3 双向核查

通过扫盲行动和告警双向核查,32类网元设备的监控率达到了100%.

2.4 新型监控团队

在运维新体制下,打造新型的监控团队,建立新型监控人员培养模型。为了提高地市故障管控质量,项目组以网络层级为标准,将省监控划分为大本地网监控和省网监控,其中,大本地网监控团队负责全网接入层的设备和线路监控,省网监控团队承担着全省核心网和汇聚网的监控职责。在集中故障管理下,新型监控团队要适应省公司对全网的调度能力和对末端网络的把控能力。

新型监控团队要按照“监”“控”“管”三类智能职责制订相应的人员需求模型和人员培养模型,新型监控人员培养模型为监控一线员工提供了职业上升通道。“监”团队的重复性工作量相对较多,需要具备初级的专业技术知识和跨专业的故障判断能力;“控”团队具备一定的故障分析经验,部分是从“监”团队重点培养的骨干员工,负责在T2环节中配合故障现场维护人员完成网管告警查询、设备状态确认、性能指标跟踪、配合操作网元等工作;“管”团队具备较高的技能水平和多年维护经验的技术人员,选择沟通能力较强的人员担任“新型值班长”。

2.5 引入辅助支撑手段

首次引入语音IVR、掌上运维、飞信机器人等辅助支撑手段,填补我省一线维护人员现场型故障辅助手段的空白。一线维护人员现场型故障辅助手段如图1所示。

2.6 故障通知新方法

根据地市提出的告警通知需求,提出将声光告警与语音IVR相结合的故障通知新方法。该方法增加了声光系统与IVR系统的关联,在声光系统界面上增加了派发IVR语音和短信提醒的功能键,控件为人工选择,这样可以实现系统自动通知,减少监控人为编辑短信和系统操作的时延。

3 集中故障管理的应用效果

流程标准化、扁平化、透明化和精细化是集中故障管理改革后“破旧立新”的主要体现。该项目旨在通过故障流程改造、支撑手段建设,打破原有的分布式、粗放式、黑匣子式的运维管理模式,确立更加集中化、精细化、透明化的运维管理新模式。

3.1 故障处理流程

故障处理流程由告警接入、故障预处理、派单及督办、故障处理、工单归档5个阶段13个环节组成,实现了从告警发现到故障解决全流程闭环管理。

3.1.1 告警接入

3.1.1.1 统一派单界面

推动传输、动环告警纳入综合告警平台实行集中监控和派单的进程,实现了在一套系统上完成全网故障监控。

3.1.1.2 开展告警双向核查

开展告警双向核查,一方面,确保了厂家OMC与综合告警平台原始告警消息、告警清除消息100%的一致;另一方面,还确保了综合告警平台与告警派单模块标准化告警100%的一致。

3.1.1.3 跨专业(专业内)告警关联

6大跨专业关联场景均已上线,截至目前,无线、传输、动环3个专业空间资源一致率达到90%以上,6类跨专业关联场景全部完成开发、上线,并完成了模拟验证,现已正式开始应用,跨专业告警关联对故障精准定位起到了重要的作用。

3.1.2 故障预处理

集中故障管理后,工单直派一线班组,省监控在短期内达到或高于地市公司原有的预处理能力,是影响一线维护人员感知的关键因素。为了进一步提升集中故障管理效能,省网管综合监控室通过梳理流程、培养人员、建设手段等途径,提升自身的预处理、自处理能力,组织各专业部室联合地市公司组成故障预处理梳理项目组,将告警分为人工预处理或自动预处理两种类型,有针对性地开展故障预处理梳理工作,在此期间,共完成了6大专业684条告警预处理的梳理工作。我省集中化故障预处理专项工作自2013-09开展以来,取得了显著的成效,全省故障拦截率从最初的10%左右上升到20%以上,极大地降低了地市维护一线人员的工作量。

3.1.3 派单和督办

3.1.3.1 派单流程改造

结合我省网络维护的实际情况,提出了以“区域+设备类型+告警名称”为判断标准的故障工单派单新模式。故障历时已从集中化前的10.17 h缩短到了目前的5.2 h,远远优于集团标准。

3.1.3.2 工单督办

语音IVR系统已经开始试用,将进一步明确通知标准,并根据试用情况逐步完善。现阶段,它已完成了各试点地市梳理短信通报、声光告警触发和故障通报、短信提醒标准,通过试运行,取得了较好的效果。确定标准条件后,后期将会逐步推广。

3.1.4 工单质检分析

严格把控工单回复质量,专门成立工单质检组,详细核查故障工单回复的规范性、及时性和故障的真实原因。这样做,一方面,可以进一步联合各专业部室加强工单压缩工作,减轻维护人员的负担;另一方面,还可以加强对不合格工单的通报和考核,提升工单回复质量。

3.2 手段建设

为了保障集中故障管理工作的稳步推进,前期从资源维护、告警派单、故障流转和考核统计四方面开展了支撑手段建设工作,支撑故障工单的直派代维。其中,主要涉及的系统包括电子运维、代维管理、综合告警、传输网管、数据网管和综合资源等系统。

3.2.1 资源维护

资源维护主要是通过综合资源、传输网管、数据网管进行资源与代维关联关系维护,完成直放站资源维护模板调整,完成其他专业资源维护模板整改,使其具备能够在资源系统上进行各专业设备代维归属关系维护的条件。

3.2.2 流程改造需求

流程改造需求包括电子运维派单规则的梳理和改造,以及故障督办功能的完善。它支持按照代维、网格、维护班组三种模式派单。

4 结束语

建立“集中化网络维护管理和属地化维护及服务支撑相结合”的运维新模式,在集中化运维的基础上,全面实施面向业务、面向客户感知的网络运维。坚持省公司提出的“集中管理、集中监控”的原则,分层落实省、市、县各级维护部门的职责,加强端到端业务管理,强化面向业务的属地服务支撑,逐步实现从“单纯面向网元和网络维护”向“面向网元和网络维护及端到端业务管理并重”转变,从整体上提升网络生产效率。

〔编辑:白洁〕

3.1.3 派单和督办

3.1.3.1 派单流程改造

结合我省网络维护的实际情况,提出了以“区域+设备类型+告警名称”为判断标准的故障工单派单新模式。故障历时已从集中化前的10.17 h缩短到了目前的5.2 h,远远优于集团标准。

3.1.3.2 工单督办

语音IVR系统已经开始试用,将进一步明确通知标准,并根据试用情况逐步完善。现阶段,它已完成了各试点地市梳理短信通报、声光告警触发和故障通报、短信提醒标准,通过试运行,取得了较好的效果。确定标准条件后,后期将会逐步推广。

3.1.4 工单质检分析

严格把控工单回复质量,专门成立工单质检组,详细核查故障工单回复的规范性、及时性和故障的真实原因。这样做,一方面,可以进一步联合各专业部室加强工单压缩工作,减轻维护人员的负担;另一方面,还可以加强对不合格工单的通报和考核,提升工单回复质量。

3.2 手段建设

为了保障集中故障管理工作的稳步推进,前期从资源维护、告警派单、故障流转和考核统计四方面开展了支撑手段建设工作,支撑故障工单的直派代维。其中,主要涉及的系统包括电子运维、代维管理、综合告警、传输网管、数据网管和综合资源等系统。

3.2.1 资源维护

资源维护主要是通过综合资源、传输网管、数据网管进行资源与代维关联关系维护,完成直放站资源维护模板调整,完成其他专业资源维护模板整改,使其具备能够在资源系统上进行各专业设备代维归属关系维护的条件。

3.2.2 流程改造需求

流程改造需求包括电子运维派单规则的梳理和改造,以及故障督办功能的完善。它支持按照代维、网格、维护班组三种模式派单。

4 结束语

建立“集中化网络维护管理和属地化维护及服务支撑相结合”的运维新模式,在集中化运维的基础上,全面实施面向业务、面向客户感知的网络运维。坚持省公司提出的“集中管理、集中监控”的原则,分层落实省、市、县各级维护部门的职责,加强端到端业务管理,强化面向业务的属地服务支撑,逐步实现从“单纯面向网元和网络维护”向“面向网元和网络维护及端到端业务管理并重”转变,从整体上提升网络生产效率。

〔编辑:白洁〕

3.1.3 派单和督办

3.1.3.1 派单流程改造

结合我省网络维护的实际情况,提出了以“区域+设备类型+告警名称”为判断标准的故障工单派单新模式。故障历时已从集中化前的10.17 h缩短到了目前的5.2 h,远远优于集团标准。

3.1.3.2 工单督办

语音IVR系统已经开始试用,将进一步明确通知标准,并根据试用情况逐步完善。现阶段,它已完成了各试点地市梳理短信通报、声光告警触发和故障通报、短信提醒标准,通过试运行,取得了较好的效果。确定标准条件后,后期将会逐步推广。

3.1.4 工单质检分析

严格把控工单回复质量,专门成立工单质检组,详细核查故障工单回复的规范性、及时性和故障的真实原因。这样做,一方面,可以进一步联合各专业部室加强工单压缩工作,减轻维护人员的负担;另一方面,还可以加强对不合格工单的通报和考核,提升工单回复质量。

3.2 手段建设

为了保障集中故障管理工作的稳步推进,前期从资源维护、告警派单、故障流转和考核统计四方面开展了支撑手段建设工作,支撑故障工单的直派代维。其中,主要涉及的系统包括电子运维、代维管理、综合告警、传输网管、数据网管和综合资源等系统。

3.2.1 资源维护

资源维护主要是通过综合资源、传输网管、数据网管进行资源与代维关联关系维护,完成直放站资源维护模板调整,完成其他专业资源维护模板整改,使其具备能够在资源系统上进行各专业设备代维归属关系维护的条件。

3.2.2 流程改造需求

流程改造需求包括电子运维派单规则的梳理和改造,以及故障督办功能的完善。它支持按照代维、网格、维护班组三种模式派单。

4 结束语

建立“集中化网络维护管理和属地化维护及服务支撑相结合”的运维新模式,在集中化运维的基础上,全面实施面向业务、面向客户感知的网络运维。坚持省公司提出的“集中管理、集中监控”的原则,分层落实省、市、县各级维护部门的职责,加强端到端业务管理,强化面向业务的属地服务支撑,逐步实现从“单纯面向网元和网络维护”向“面向网元和网络维护及端到端业务管理并重”转变,从整体上提升网络生产效率。

〔编辑:白洁〕

猜你喜欢
应用效果
体验式教学法在小学品德与生活教学中的应用研究
任务驱动教学法在C 语言教学中的应用研究
手术中个性化心理护理在原发性青光眼患者中的应用
健脾扶正汤在晚期胃癌治疗中的应用
化疗联合CIK细胞治疗卵巢癌的临床观察
负压封闭引流技术治疗四肢创伤复杂创面的临床应用分析