本地网网优性能实时监控系统的构建

2013-07-14 08:06田夏利
赤峰学院学报·自然科学版 2013年17期
关键词:网元线程监控

田夏利,熊 莹

(武汉理工大学华夏学院,湖北武汉430223)

本地网网优性能实时监控系统的构建

田夏利,熊 莹

(武汉理工大学华夏学院,湖北武汉430223)

提出了一个网络优化监控中心的构建方案,本系统采用现代计算机信息技术、先进可靠的系统平台和稳定高效的应用软件,建立通讯功能强、操作界面直观方便,集BSC监控管理、基站监控管理、小区监控管理、故障告警统计、实时告警智能排障处理、自动巡查检测基站运行状况、自动检测小区性能状态指标、告警前转、自动故障派单等若干先进功能于一体的现代化计算机局域网系统.

网络优化;实时监控;告警处理

1 引言

武汉(移动)本地网网优中心目前在网络优化方面侧重于对设备运行情况和运行性能的监控,无法准确反映客户使用网络通信时对网络质量的实际感知情况.目前主要采取手动搜告警的方法对TCH掉话和拥塞进行实时查看,对全网基站的性能监控工作量极为巨大,人工监控相对困难,有时甚至会遗漏一些重要的告警,所以我们需要实现网络性能告警自动化.即可以实时地对网络的运行状态进行监视,对网络优化关键性能指标的实时检测和对特定事件的记录,对超出门限值的指标应予告警等.

2 系统建设目标

通过本系统建立武汉本地网网络优化监控中心.系统的实时监控模块除监控到小区级的用户感知告警外,还为维护人员建立健全实时、准确、实用、方便的符合武汉本地网特点的小区性能监控、维护手段,把维护人员从繁重的重复劳动中解放出来,把有限的精力投入到更高层次的网络优化工作中去.同时,系统的各类统计报表模块为各级领导提供网络扩容、网络优化、基站建设方面的决策支持.

系统总体框架——软件模型

武汉本地网网优性能监控系统技术需求有如下特点:适应业务的变化、适应网络的变化、适应应用报表的变化、网络资源的安全性、大容量数据存储处理等.因此我们建议的系统软件模型采用三层客户机/应用服务器/数据库模式(C/AS/DS),同时引入数据仓库技术.系统总体框架如下图所示:

采用三层C/AS/DS结构,形成了业务表现层、业务管理层、数据采集管理层三个层次,降低了数据库服务器的负担;同时在业务管理层实现了用户管理等业务功能,使得在业务变化时,只需在本层调整相关构件,大大提高了系统的可管理性、可扩展性;三层C/AS/DS结构在系统的安全性方面也较二层C/S结构有重大的提高,使得对权限的管理从数据级的控制上升到业务功能级的控制;另外,三层C/AS/DS结构更适合在分布式广域网环境下运行,便于以后系统的扩展、升级.同时在业务逻辑层使用了多线程技术来提高系统的处理能力.

3 系统的技术开发路线

根据选用的软件模型,系统采用严格的分层设计思想,构建了网优数据适配层、业务处理层以及上层应用等三个逻辑层次,程序处理与逻辑处理分离技术,每个逻辑层都有相应的基础模块.

数据采集层主要通过多线程实时监控硬件设备的使用状态,完成数据的动态采集,业务逻辑层对数据通过映射、变形、汇总、分析、保存、转发等提交到上一层,应用层主要是对客户前端发出的请求数据或业务逻辑层转发数据进行相应的处理并呈现.

在业务逻辑层的描述中,我们将业务逻辑和业务操作分离开来.所以在业务操作请求与具体的业务操作之间需要一个映射层,而且由于业务操作的分散性和数据格式的多样性,该层还需要保障信息可靠传递和转换不同数据格式的功能.

业务操作是业务逻辑的基础.业务操作层的作用是把业务请求转化为一个个具体的数据操作.我们通过将业务中一个具体操作转化为一个响应的应用逻辑,从而将业务操作的请求和数据源分离.

告警管理模块

该模块为系统核心模块之一,包括告警采集、分析、入库、发布、前转等子模块.该模块普遍采用多线程技术,各子模块都由一组独立的线程组成,系统自动调整各线程组的线程数量,以使服务器达到最佳性能.各子模块相互关系如下:

告警采集:采用多线程技术同时连接20个BSC,采集各类告警数据,包括A1告警、A2告警、各类性能告警.接收线程收到数据后将实时反馈给服务器的告警分析线程,让告警转入后续处理过程.

告警分析:根据用户定义的规则分析高进采集线程反馈的数据,产生其他模块能够理解的xml格式的告警信息,包括告警报告号、告警网元、告警基站、告警小区、告警级别、产生时间、告警标题、告警正文等信息,如果是小区告警,系统还需分析出告警MO、ALARM SLOGAN等信息.同时该子模块还维护各BSC的活跃告警列表,以减少对数据库的直接操作,提升数据库服务器的整体性能.告警分析完成后将转入入库、发布、前站等流程.

告警入库:告警入库线程组根据告警分析线程分析出的告警列表,将新产生的告警插入数据库相关数据表中,当告警消除时在数据库中做相应标记并记录消除时间.

告警发布:告警发布程序负责把分析过的告警数据发送到客户端,由客户端完成告警的显示及声光提示等功能.告警发布线程组的线程数量跟当前联机的客户端数量一致,即一个线程管理一个监控客户端的告警发布.

告警前转:通过本系统的短信网关接口模块,告警前转模块根据前转规则配置将符合前转条件的告警信息(一般为重大告警)发送到相应的手机上,提醒维护人员及时处理.

网优经验管理模块

系统提供网络优化经验管理机制,用户可针对各类告警填写处理步骤及每个步骤的含义,一方面实现维护经验的积累,另一方面,当障碍发生时系统会搜索经验库,并作为建议恢复方法显示在用户操作界面中,供用户参考.

命令代理模块

系统提供命令代理机制,整个系统中只有服务器连接网元,保证所有命令都只从服务器发出,客户端不直接向网元发送任何命令;同时服务器建立授权命令列表,提供命令审核机制,该审核机制只允许经授权的、特定的、安全的、不对网元造成影响的命令通过,保证交换机的安全性;另外,当有成批命令发往网元时,系统提供暂缓执行的保护机制,降低系统给网元带来的负荷.系统还提供命令记录、查询机制,对发往网元的命令记录详细的日志,以备用户事后查询.

EOMS接口模块

系统提供与EOMS系统的接口,并可根据用户配置的规则生成故障工单自动发送给相关部门或相关人员,无需人工干预,规范了障碍处理流程,加快了障碍处理速度,减少维护人员工作量.

智能排障:系统提供智能化的、可配置的自动排障机制:用户可根据特定障碍的处理流程撰写障碍处理脚本,当告警发生时系统执行相应的脚本,向网元发送障碍恢复命令,自动处理并恢复障碍,达到无需人工干预即自动恢复障碍的目的,一方面减少了维护人员的工作量,另一方面极大的提高了障碍处理效率,缩短了障碍恢复时间.

系统自带一定的处理脚本,经培训后,用户可以自行编制这种脚本,经过不断的积累,系统会变的越来越“聪明”、越来越人性化,需要人工处理的障碍会越来越少,维护人员的重复劳动工作量也会越来越少.

TCH拥塞、掉话监控模块

系统根据用户设定的采集频率7×24小时自动采集各小区的TCH拥塞、掉话数据,记录在数据库中,并按用户设定的门限值产生相应告警发送到客户端,通过GIS系统在客户端进行准确的图形化再现;同时客户端程序也提供列表化的呈现方式,将告警统一呈现在表格中,并提供简捷实用的过滤方法方便用户查看告警.系统每天自动产生《TCH拥塞率超标小区排名表》、《TCH可用率不足小区排名表》、《TCH掉话率超标小区排名表》等报表,方便维护人员进行网络优化.

话务量异常管理模块

系统自动保存30天每小时每小区的话务量,以上周同一时段的平均话务量为标准,如果当日该时段的话务量高于或低于该标准的40%则产生告警,时间以小时为单位.

4 结束语

本文阐述了一种扩展性好、功能全面、运行稳定的网络性能监控系统.提出了层次化、模块化的系统设计模型,描述了各模块的实现方法.通过开发实时监控告警系统以后,起到对网络系统的监测和控制.随着它的诞生,业务信息系统的运行搭建了统一的管理平台,从而减少了人工维护的成本,提高了数据管理的效率,使业务得到了集中,技术风险的可控性提高.

〔1〕陈蕊.移动通信机房设备故障集中监控探讨[J].科技探索,2011(10).

〔2〕刘进军,赵生慧,等.可扩展的网络性能监控系统[J].计算机工程与设计,2010,31(10).

TN919.2

A

1673-260X(2013)09-0133-02

华夏学院科研基金资助项目“面向用户的网络性能实时告警系统”(HX 20120201),(湖北移动通信有限责任公司武汉运维中心“武汉本地网网优性能监控系统工程”,合同号:ZHIYUAN 200506)

猜你喜欢
网元线程监控
The Great Barrier Reef shows coral comeback
基于C#线程实验探究
基于国产化环境的线程池模型研究与实现
你被监控了吗?
Zabbix在ATS系统集中监控中的应用
一种全网时钟同步管理方法
浅谈linux多线程协作
PDCA循环法在多重耐药菌感染监控中的应用
Java EE平台在综合网元管理系统中的应用研究
S1字节和SDH网络时钟保护倒换原理