小基站SCTP 部分断链原因分析

2020-05-20 06:39缪洪兵
数字通信世界 2020年4期
关键词:网关基站传输

缪洪兵

(南京熊猫通信科技有限公司,南京 210000)

1 小基站SCTP 部分断链

随着5G 时代的来临及4G 时代的成熟发展,基于4G 或5G小基站的使用越来越广泛,由于小基站控制面传输是基于SCTP协议的,SCTP 在实际使用过程中在正常连接一段时间后可能会出现各种原因的断链,SCTP 一旦断链很可能在短时间内无法恢复正常,无疑会影响用户体验,怎样尽可能减少SCTP断链的发生,进而提升小基站性能和改善用户体验无疑是一项值得研究和推进的重要工作。

2 部分断链原因分析及应对

SCTP 为流控制传输协议(Stream Control Transmission Protocol),在RFC4960中被定义,该协议通常在移动通信网络(3G,4G,5G 等)中被广泛使用,用于基站与核心网间控制面的通信传输。是IP 层之上的传输层协议,与TCP,UDP 同等层级,SCTP 是提供基于相关不可靠传输业务的一种面向连接的可靠的数据报流传输协议,它可以在收发两端之间提供有序的和稳定的数据传输。我们也可将其看做一种改进型的TCP 协议,但比TCP 更适合移动通信网络,比如该协议比TCP 要多一种握手(handshake)确认机制(TCP 3次,SCTP 4次),并且SCTP 采取了更合适的拥塞控制处理(支持多流multi-stream)、更佳的实时性等诸多优异之处,因此被选择为移动通信中控制面的传输协议,在网络架构的位置如图1所示。

图1 SCTP在移动网络通信层中的位置

尽管SCTP 优点如此之多,但在实际应用中,由于移动通信网络的复杂性,SCTP 在正常建立连接一段时间后仍有时会断链(本文不讨论通信双方刚开始就无法建立SCTP 链路的情况),通常会表现为最终用户的移动终端在某一段时间内无法接入网路,并使得相关业务无法进行。本人根据基站侧多年的实践经验总结出部分可能原因并给出可能的因应方法如下:

(1)网络的延时和抖动。网络的延时和抖动也可能会引起SCTP 断链,可用最常用的ping 包加以鉴别,网络的延时和抖动会导致网络丢包,同一网络环境下若丢包率较长时间内较高,则会引起SCTP 断链。若发生这种情况,应对相应的网络加以优化,尽量减少这方面问题得发生。

(2)设备硬件地址是否合法,设备内硬件地址是否存在冲突。设备的硬件地址(或者叫物理地址,通常为MAC)首先应检查是否为被合法分配的地址,若是非法地址则不能保证通信的正常,有可能和公网上的其他设备相冲突,在硬件地址合法的前提下,还应检查设备内是否有多个硬件地址,这些地址内部是否有冲突。一旦出现设备内或与公网上其他设备的MAC 地址冲突,这会引起图1数据链路层通信的问题,进而会引起承载其上的各层通信包括SCTP 的通信异常,并可能会影响SCTP 的断链。这种情况下应及时重新调整分配设备的MAC 地址,保证该地址的惟一性及合法性,则这方面的冲突导致的SCTP 断链将不会再发生。

(3)与安全网关的通信问题。安全网关侧出问题或与安全网关的交互也可能会导致SCTP 断链,由图1可看出移动通信网络中在IP 层与SCTP 层之间还有一个IPSEC 层,由于在Internet上,如果不做相关处理则所有的信息传输是不安全的,业界通常在小基站与核心网(或相关业务网关)之间加了一个安全网关对IP 层级通信进行加密(security)处理,在工程调测中一般要注意小基站与安全网关的相关参数配置是否一致,举例:比如两端配置文件(ipsec.conf)中的reauth 和rekey 是否都为”yes”或都为”no”?如果不能看到安全网关的配置,其实在IPSEC 的相关LOG中一般情况下也可判断配置上是否有异常。如果配置不一致,上例则会引起应进行身份验证(reauthenticate the peer)但没进行身份验证,从而导致安全网关分配给小基站的虚IP 地址(virtual IP address)失效,并从而会导致籍之建立的SCTP 连接必然断链。

图2 安全网关与IPSEC

另外,由于通信的复杂性,安全网关本身也可能存在一定概率的故障,如果可判断多台小基站同时断链,或相关友商的设备也同时断链,则可断定安全网关侧出问题了。这种情况下可向运营商或安全网关厂商及时反馈并尽快加以解决。

(1)SCTP 通信两端的配置问题。SCTP 通信两端的相关配置也可能导致正常通信一段时间后会断链,典型的有MTU(最大传输单元Maximum Transmission Unit)设置过小或过大都可能导致SCTP 链路异常,这时重新将MTU 调整至合适的值即可。

(2)其他可能原因。其他相关原因也可能导致SCTP 断链,设备本身或通信对端的软件BUG 也可能导致SCTP 断链,这种SCTP 断链并不是SCTP 或SCTP 关联协议层通信原因造成的,这种情况下区分排查清楚即可。另外,图1中承载SCTP 的各层如物理层、数据链路层、网路层,IPSec 层以及SCTP 层本身若出现相关问题也很可能会导致SCTP 断链,在具体通信工程问题中,相关的问题还得具体问题进行具体分析,结合相关的抓包工具和设备的相关LOG,按图索骥并逐步缩小问题范围,总会找出问题原因并加以解决。

3 结束语

导致SCTP 链路在正常运行一段时间后再断链的原因可能多种多样,本文仅分析了部分可能的原原因并给出可能的解决办法,以期抛砖引玉。

猜你喜欢
网关基站传输
基于FPGA的工业TSN融合网关设计
轨道交通信号系统无线传输应用
一种主从冗余网关的故障模式分析与处理
牵引8K超高清传输时代 FIBBR Pure38K
5G基站辐射对人体有害?
5G基站辐射对人体有害?
关于无线电力传输的探究
基于6LoWPAN的嵌入式多网关系统设计与实现
天地一体化网络地面软网关技术及其应用
基于移动通信基站建设自动化探讨