关于5G核心网高可靠性及容灾能力的研究

2022-06-17 23:25:刘赢胡旋侯磊磊章臣斌
卫星电视与宽带多媒体 2022年9期
关键词:容灾信令核心网

:刘赢 胡旋 侯磊磊 章臣斌

【摘要】随着5G网络的全面应用,运营商已在2B市场(针对企业的市场)全面发力,在各垂直行业进行了大量5G应用场景探索和部署。行业用户的应用场景有别于普通个人用户,对5G网络的安全性、高可靠性、业务连续性均有更高的需求,因此网络容灾能力成为一个重要课题。本文重点阐述5G核心网控制面、用户面在应急恢复、高可靠性部署、5G网络极端情况下的“逃生”方案进行了分析研究。

【关键词】5G核心网;网络容灾;组网架构;控制面;用户面

中图分类号:TN929                                  文献标识码:A                          DOI:10.12246/j.issn.1673-0348.2022.09.012

随着通信技术的快速发展,自上世纪90年代末以来,我国移动通讯网络从2G逐渐发展到5G网络。从2G引入、3G跟随、4G同步到5G引领,我国的通信行业一次次实现跨越式发展,每一次通讯技术升级换代都对社会发展带来巨大影响与推动,移动网络的应用场景也从最开始的基础语音业务进化为万物互联时代。应用场景的改变对网络高可靠性以及应急恢复提出了更高的要求。本文结合5G组网架构特点,对网络存在的潜在隐患进行了分析,结合业界常用容灾能力进行了总结,并对极端情况下如何利用4G网络“逃生”进行了研究。

1. 5G组网架构

5G核心网通常可分为参考点方式呈现和服务化架构方式呈现。具体内容如下。

1.1 参考点方式呈现

核心网采用控制转发分离架构,实现移动性管理和会话管理的独立进行。5G用户面引入了“流概念”(类似但不同于4G的“承载”),即QoS参数直接体现在会话中的不同流。通过不同的用户面网元可同时建立多个不同的会话,并由多个控制面网元同时管理,实现本地分流和远端流量的并行管理。参考点方式呈现如图1所示。

1.2 重要参考点简介

参考点是特定两个功能块之间的交互界面,是标准的双方之间的协议映射关系。本文重点介绍与容灾方面相关的内容,因此仅介绍如下参考点或接口。

N4:用户面UPF与控制面SMF的参考点,在垂直行业应用中下沉UPF也使用N4接口与控制面互通,是一个重要的参考点。

N8:AMF与UDM的参考点,轻量化控制面下沉应用中重要的参考点。

N10:SMF与UDM的参考点,轻量化控制面下沉应用中重要的参考点。

N12:AMF与AUSF的参考点,用于鉴权的消息交互,轻量化控制面下沉应用中重要的参考点。

S6a:4G网络MME网元与5G网络UDM互通的重要接口,主要用于数据业务消息交互。

Cx/Sx:IMS网络与5G网络UDM交互的重要接口,主要用于语音业务消息交互。

1.3 服务化架构方式呈现

服务化架构是在控制面釆用API能力开放形式进行信令的传输,目前业界主流机型底层协议均采用HTTP2协议。在传统的信令流程中,很多的信令消息在不同的网元间交互使用不同的协议类型,这为故障定位和运维带来了一定繁瑣性。5G网络控制面将相同或相似的消息提取出来以API能力调用的形式封装起来,对交互协议进行了统一。服务化架构方式呈现如图2。

2. 5G组网方面的潜在隐患

5G网络引入了网络功能虚拟化NFV概念,控制面完全基于云资源池通用硬件,随着云化技术的不断发展,三层解耦一定是未来发展的趋势。目前各运营商为了安全起见,都引入了多DC(数据中心)组网模式,以省为单位或以大区为单位组建双DC或多DC部署。由于5G核心网的高度集中,在实际运营过程中也产生了一定的风险隐患。按照组网结构,可分为控制面隐患和用户面隐患。

2.1 控制面隐患

信令风暴:核心网高度集中后在容灾应急启动的过程中,如果网络所带的用户较多,同时对控制面网元卸载用户操作未引起足够的重视而没有采用合理的流控,那么势必会引发信令风暴。经过测试,5G核心网在DC级容灾时,信令交互量是平时的5倍以上。

控制面暴露:在垂直行业应用中,5G核心网为给用户提供低时延场景,通常将UPF下沉至用户机房或者与第三方UPF相连,这样就形成5G核心网暴露面。

2.2 用户面隐患

用户面UPF单点部署:5G建网初期,为了节约投资,在为垂直行业用户提供低时延解决方案时,通常会采用单点下沉UPF方案。而这些重要行业用户有的是24小时不间断生产。这为5G网络高可靠性、高连续性埋下隐患,例如UPF升级、硬件故障等情况都有可能影响用户的使用。

用户面UPF或定制DNN单点接入:用户面UPF或用户定制DNN在开通初期如果考虑不够周全,可能会出现与控制面SMF单点对接的可能。当控制面SMF做升级或调整参数需要卸载用户时,可能引发UPF无法使用故障。这个问题比较好解决,平时做好数据比对和隐患排查,发现问题时及时更正数据配置即可。

3. 各场景容灾解决方案分析

考虑到上述隐患,各运营商在建设和维护期要对各种潜在的风险隐患进行排查梳理以及制定网络容灾策略。网络容灾大致分为控制面容灾和用户面容灾两大部分内容。按照应急等级又可分为服务器或网络设备硬件级、虚机级、虚拟化网元级、DC级、机房级等。

3.1 控制面容灾方案分析

服务器或网络设备硬件级:目前各大运营商对服务器以及网络设备级的容灾考虑是比较全面的,由于云架构的引入以及云化带来的好处,基本上单一底层硬件故障时并不会引发上层应用过多的反应,甚至单一设备故障上层应用无感知。

虚机级:虚机以及虚拟化网元目前业界在容灾方面相对成熟。虚机层不出现大面积故障或软件级BUG通常情况下不会引发大面积故障。

虚拟化网元级:虚拟化网元级容灾涉及网元比较多,容灾时要充分考虑系统的容量配置,避免出现容灾后系统过载,从而影响业务。某些国外设备在过载情况下可能会出现系统锁死现象,后果非常严重。另外,SMF等虚拟化网元以及用户面网元UPF在启动容灾时涉及用户卸载,在日间忙时可能会对周边网元产生信令冲击。因此,这些网元在启动容灾操作时一定要做好流控,尽量放在夜间非忙时进行操作。

DC级和机房级:极端情况下,各运营商可能会面临DC级或机房级容灾,在5G建设初期国内各运营商都已经考虑过该场景下的应急预案,但随着用户数的不断增加,DC级或机房级容灾变得不再那么容易实现。其中主要原因包括一是系统容量的限制,要满足DC级容灾,首先两个DC要满足1+1备份关系,另外周边网元也要有足够的资源配合完成。二是信令风暴抑制,当极端情况下启动DC级或机房级容灾时,信令风暴问题要做好深度评估,稍有不慎很可能造成“雪崩”效应,不但5G网络自身没能完成自救,还很有可能对4G或IMS网络产生严重冲击。一般解决该问题都是通过在AMF或MME等接入管理网元以及DRA等信令转发网元采用“流控”方式进行管制。或者在基站无线侧进一步压降DC级容灾所产生的信令风暴。

5G逃生4G网络:4G网络在相当长一段时间内都会做为一套“打底”的网络与5G网络共存。因此业界也对极端情况下5G用户是否能利用4G网络做为5G网络的“逃生”方案做了探讨。经过研究分析,虽然4G和5G网络是一套深度融合的网络,如图3所示,HSS与UDM、PCF和PCRF、UPF和PGW-U是原生融合,而MME和AMF是深度融合,因此,如果仅仅对少量2C用户进行容灾,那么在不考虑时间因素是可行的。

值得注意的是,如果采用HSS Proxy代理方式寻址的运营商(5G用户数据只在UDM里存在,在4G网络接入时由HSS通过Proxy机制路由至UDM完成接入和会话),在极端情况下2C用户逃生4G网络也存在诸多问题,主要是HSS容量问题、信令风暴问题、UDM用户数据如何快速转换成HSS格式并加载至HSS系统等问题都需要耗费一定的资源和人力,而且并不容易实现。

如果是5G 2B行业用户,极端情况下很可能就无法实现逃生4G网络,因为4G网络无法完全继承5G网络的业务特性,比如切片、定制DNN、低时延、多连接业务等等。也就是说即使用户可以回落到4G网络,但也无法完成相应的业务。综上所述,利用4G网络作为5G网络的逃生手段仅能保证部分2C/2B用户基本的数据和语音业务,5G特色业务无法实现。

控制面C-IWF隔离:5G定制网主要面向行业客户,满足不同行业客户数字化转型升级过程中对网络、边缘、云、应用等的差异化需求。例如:低时延场景、自主管理部分控制面网元等场景,这就涉及用户面网元UPF以及AMF/SMF/PCF等控制面下沉至客户园区。

5G核心网需要与各种厂商的大量网元(UPF/UDM/AMF等)做互通,操作及对接复杂,增加运营成本、不便于扩展,因此设备提供商在积极探索C-IWF(控制面-信令互通网关)方案。希望通过C-IWF的引入,满足定制网业务安全敏捷部署、N4/N8/N10/N12/N14接口信令转接等需求。如图4所示。

C-IWF可起到安全隔离作用,定制网下沉网元通过网关一点接入大网,与大网进行隔离,网关具备客户网元认证、消息过滤、信令转接等能力,由网关实现大网与定制网的安全隔离。还可实现信令互通,将涉及定制网的网元选择、消息转发等操作都统一转发到网关,由网关实现信令转接,保证大网配置的稳定。还可在一定程度上降低5G核心网与众多UPF进行繁杂的对接繁琐性。目前该方案处于积极探索阶段。

3.2 用户面的网络容灾分析

5G网络在2B行业用户应用过程中,由于前期应用场景不明朗或为节约投资成本,对于下沉UPF的建设一般采用单点方式,这为后期运维带来了风险隐患,设备故障、软件升级都有可能造成业务中断,不符合高可靠性、高安全性要求。通常这类风险可通过“中心/地市UPF集中备份容灾”和“边缘双UPF主备容灾”解决方案予以规避。

3.2.1 地市/中心UPF集中备份容灾

如图5所示,在地市或中心建设一套下沉UPF,将其作为多园区UPF共用的备份UPF,在兼顾投资产出比的同时,可有效解决园区UPF单点运行所带来的风险。

采用该方案启动容灾时,数据需要出园区,数据路径不同,会稍有延迟。因此,对数据传输要求敏感的企业不太适合。另外,多园区故障,可能存在备份UPF资源抢占;在建设过程中需充分考虑边缘UPF的容量。如果企业用户的终端为固定IP地址,备份的UPF还要考虑接入数量。

3.2.2 边缘双UPF主备容灾

边缘双局主备容灾是中心/地市UPF集中备份容灾机制的补充。如图6所示,园区UPF在建设的时候,采用主备UPF工作模式,安全性和可靠性得以提升。适合企业对数据要求不出园区、终端要求地址不变等应用场景,该方案支持的静态用户数量不受主机路由条目限制。在启动容灾时,数据也可以保证安全性和时效性,企业数据和应用场景都不发生改变。当然,该组网方案一定程度上会带来建设成本的增加。

近两年境内外知名运营商发生过多次重大网络故障,从获取到的信息来看相当一部分原因是网络潜在隐患未排除导致的。5G核心网与前几代核心网相比,不论是从组网和复杂度上都有了明显提高,而且应用场景也变的丰富多样,有些还是非常重要的垂直行业用户(24小时生产),这就对维护工作者提出了非常高的要求。本文重点对5G网络组网进行了分析,主要对控制面和用户面高可靠性、高连续性以及在容灾策略方面进行了研究,希望能对从事5G核心网维护的业内人士提供一些借鉴。

参考文献:

[1]李雪芳,吉翔川,丁志刚,潘洁,韦薇,张鑫磊.5G网络安全风险应对思路研究[C]//推动网络演进 促进应用创新——5G网络创新研讨会(2021)论文集.,2021:35-39.DOI:10.26914/c.cnkihy.2021.039105.

[2]余海波,金志坚,秦二民.5G移动专网技术方案探讨[C]//推动网络演进 促进应用创新——5G网络创新研讨会(2021)论文集.,2021:346-350.DOI:10.26914/c.cnkihy.2021.039166.

[3]俞樂.5G轻量核心网在应急通信中的应用分析[J].中国新通信,2021,23(16):1-2.

[4]吴远清.5G移动通信核心网关键技术研究[J].长江信息通信,2021,34(08):184-186.

猜你喜欢
容灾信令核心网
5G核心网关键技术布局及应用
浅谈服务化的5G核心网切片管理系统研究与实现
探析对5G核心网演进方向的展望
华为发布核心网自动驾驶网络白皮书
网内信令链路负荷分担不均原因研究
Oracle MAA在汽车行业电子政务平台中的应用
浅谈JSQ-31 V5数字程控用户交换机NO.7及NO.1信令参数设定及不同
校园一卡通服务端高可用性改造实施方案
降低容灾门槛