MSC POOL工作原理及应急方案探讨

2011-11-13 10:28黄斌
移动通信 2011年16期
关键词:宕机话务高负荷

黄斌

摘要文章介绍了MSC POOL的原理与优势,归纳了MSC POOL的几种故障类型及相应的处理方案,并通过维护实例予以说明。

关键词MSC POOLServerMGWBSC核心网

1MSC POOL的原理

在3GPP R99和R4版本中,核心网延续了传统的树形网络结构,一个RNC只能被一个核心网节点控制(如MSC Server),如果核心网节点发生故障,其所管理的RNC就无法正常工作。基于3GPP R5(3GPPTS23.236)的MSC POOL技术引入了“池区”(POOL Area)的概念,多个核心网节点组成一个区域池。和以往RNC/BSC与MSC一对一的控制关系不同,在MSC POOL内的每个RNC/BSC都可以受控于池内所有的MSC节点,每个MSC节点都同等地服务池区内所有RNC/BSC覆盖的区域,连接到RNC/BSC的终端用户可以注册到池中的任意一个MSC节点。

换言之就是多个MSC共同服务一个大的服务区,所有MSC以POOL组方式共同工作,其中不同类型和厂家的BSC与传统交换必须升级支持MSC POOL。POOL内每个BSC/RNC都能受控于POOL内每个MSC,控制逻辑关系全连接,BSC/RNC被POOL中的多个网元同时管理,终端用户可以按照负载均衡的原则注册到POOL中的任意一个节点以共享资源。

MSC POOL技术的引入,提供了一种突破点到多点的连接限制、实现网络资源共享的手段。图1表示了MSC POOL的组网结构。

2MSC POOL的优势

MSC POOL优良的组网技术为运营商对移动网络的运维带来了诸多优势,其主要有:

(1)减少核心网络信令开销负荷

POOL提供了公共MSC/SGSN服务区,原有MSC/SGSN间的位置更新全部优化为MSC内的位置更新。这样,话务负荷就被平均分配给资源池中的MSC,对每个MSC来说没有负荷高峰,而且池内无MSC局间切换;即MSC POOL可大大降低局间的位置更新/切换次数,减少MSC和HLR的系统信令开销,降低核心网节点负荷,提升网元容量,减少网元占用。在3G网络正在部署发展的阶段,MSC POOL可以有效减少2G/TD网络间的重选次数,提升系统间切换成功率,为TD发展提供可靠保障。

(2)核心网设备负载均衡

传统网络中不同节点由于覆盖范围不同,话务峰值出现在不同时间不同地点,网络规划都按各自最大可能出现的话务来配置单个节点。MSC POOL的引入,使话务在所有节点中平均分配,避免网络资源不均衡利用。

(3)网络规划扩容灵活,简化工程实施

MSC POOL中的节点数量可以随着话务量的增长而逐步增加,只需在MSC POOL中增加一个MSC,即可方便地实现扩容,不需要割接,不影响正常的网络运行,也不需要重新划分服务区。同时,无线网络与核心网络实现分离规划,不需要无线网络跟随核心网络的扩容来费时费力地重新划分服务区,从而减少了对无线接入网的影响。

(4)实现网络级冗余备份安全保障

当MSC POOL中的某个节点发生故障时,BSC会把接入网络的终端的服务请求(位置更新、试呼)重新分配给POOL中仍然正常工作的MSC,从而实现零宕机时间,提高MSC服务性能;而POOL中的其它MSC/MSCServer会接手故障节点的话务,丝毫不影响用户的使用。当需要进行维护或升级时,只需以受控的、适当的方式暂停某个MSC/MSC Server的服务,激活话务的重新分配,即可实现完全自动的冗余分配。

3应急方案

由于MSC POOL的引入增强了核心网的安全性及稳定性,所以对于MSC POOL的维护显得尤为重要,做好POOL维护的应急预案对日常工作有着相当重要的意义。以下为常见的几种MSC POOL故障的处理方法:

3,1Server

(1)POOL内Server高负荷

在MSC-S高话务情况下,立即进行用户重分配反而会对MSC-S造成冲击,可以先采用GRI(GMSCRoaming Interlocation)分流等方法降低MSC负荷,然后再迁移该MSC-S(假设MSC1)部分用户到POOL内其它MSC-S。

1)第一步:GRI分流

把高负荷的MSC的呼叫通过其他低负荷的MSC来转接,减少高负荷MSC与HLR之间的信令交互,从而降低MSC的负荷。在MSC高负荷可以预先判断的情况下,应该提前根据话务预测来做好高话务MSC的话务分流比例以及分流局向的计划,尽量做到把高话务均衡地转接到多个低话务的MSC。遇到突发情况,可以直接把话务分流到话务比例较低的互联关口局上进行转接。

2)第二步:迁移MSC1部分用户到POOL内的其它MSC

检查POOL内其它MSC-S的负荷和用户数,确定POOL内其它MSC-S可承担该MSC-S的部分话务,根据情况选择迁移比例;观察MSC1的用户迁移情况,并关注POOL内其它MSC-S的负荷情况,确保用户迁移不会引起其它MSC负荷过高引起限呼,如果其它MSC负荷过高,参考用户迁移的方法进行动态调整。

(2)POOL内某MSC Server工作不稳定,呼叫困难或无法正常处理话务

POOL内某一MSC Server(假设MSC1)工作不稳定,能保证与BSC的信令联系,但无法正常处理话务,在短时间内无法定位故障原因及修复故障。为了快速恢复话务处理,利用MSC POOL特性,把MSC1用户迁移到POOL中其它MSC-S,并将MSC1隔离,用POOL内其他MSC来承载MSC1的业务。

(3)POOL内某MSC Server宕机

由于MSC POOL具有实时自动容灾备份功能,当POOL内某MSC宕机后,主被叫业务都可以自动重分配到POOL内其它MSC。由于MSC宕机后,其POOL内MSC要增加对宕机MSC用户的被叫恢复信令处理,会引起POOL内MSC负荷升高,需要重点关注POOL内其他MSC的负荷情况,如果负荷过高,则启动负荷分流方案。

3.2MGW

(1)BSC双连MGW,POOL内某MGW宕机引起BSC连接的另一MGW License受限

当BSC所连的一个MGW发生该故障时,由于BSC双连MGW,故障MGW下带的BSC业务会全部转移到BSC连接的另外一个正常的MGW上,造成正常MGW话务受冲击而引起交换机设备受限,扩大故障覆盖面。为避免正常MGW受限制,可以采用两种方法:1)限制小区接入;2)闭塞部分AN设备。

(2)POOL内某MGW宕机,BSC单连MGW

发生该故障时,采用本地网MSC N+1容灾备份方案,实现BSC的准实时容灾。前提条件:利用退网的多

个MSC作为容灾MSC,提前布放好POOL内现网BSC到容灾MSCI的A口电路,并且在容灾MSC、BSC中提前定义好相关数据。

3.3BSC

POOL内出现某个BSC到某个MSC Server(假设MSC1)的A接口电路占用率过高。对此,可以采取以下措施进行处理:

(1)检查POOL内其它MSC-S的CP负荷、用户数以及A接口占用率,确定POOL内其它MSC-S可承担MSC1的话务;

(2)将MSC1的部分用户迁移到POOL内其它MSC上;

(3)观察MSC1用户迁移情况,并关注POOL内其它MSC-S的负荷情况,确保用户迁移不会引起其它MSC负荷过高从而引起限呼。如果其它MSC负荷过高,参考用户迁移的方法进行动态调整;

(4)确认MSC1的指定比例用户迁移后,观察高负荷A接口占用率是否已经正常,并在POOL内所有BSC上恢复数据。

4维护案例

(1)故障现象

POOL内某一个Server出现某LAC下小区用户无法做被叫,暂时无法接听到通知音,但是做主叫正常。通过指令查看,该LAC下的小区异常。

(2)处理过程

1)利用POOL的特性,在相应的BSC/RNC中启用用户重选功能,将该BSC/RNC中的用户驱赶到POOL内其他的MSC-S上,以此来减少用户投诉,提高用户感知;

2)根据用户投诉情况和故障现象,在必要时更改BSC中的T3212时长,以此使得用户能更快速通过重选机制迁移到其他MSC-S上;

3)待用户全部迁移完成后,恢复原有的T32121时长,并对登记在故障LAC下面的用户进行拨测,确认用户完全通话正常。

(3)过程回顾

从该故障处理的过程可以看出,当POOL内的某一个MSC下带的用户出现异常,但该MSC尚未退服,仍可以处理登记在其上的用户业务的时候,可以通过启用用户重选机制的方式来把用户迁移到POOL内其他MSC上,以此减少用户投诉,改善用户感知。

5结束语

MSC POOL技术为移动核心网的组网结构带来了革命性的变化,各个MSC/MSS不再是相对独立的网元,而是结合成了一个有机的整体,核心网资源在整个POOL内做到了共享,不仅提高了核心网的可靠性,也有效地提高了核心网络资源的利用率。同时我们也应该看到,维护手段需要随着MSC POOL工作进展而不断更新和完善,这对于缩短MSC POOL的故障处理时长、改善客户的感知度有着重要意义。

猜你喜欢
宕机话务高负荷
面向感知的短时高负荷定位研究与应用
岛内人口普查刚启动就遇“宕机”
基于感知高负荷小区的快速响应策略研究
浅析电信话务控制
基于集中采购的分布式系统的设计与实现
一起民航气象数据库系统进程频繁宕机故障分析及处理方法
“互联网+”高速公路客户服务话务平台研究
艾默生网络能源发布《2016年数据中心宕机成本》
高负荷小流量涡轮气动性能分析
话务统计分析在网络运行中的重要性