基于多源数据的铁路5G-R运用质量评估系统设计

2024-02-26 03:42梁轶群欧阳智辉王文华
铁道标准设计 2024年2期
关键词:数据源架构评估

梁轶群,李 辉,欧阳智辉,王文华

(1.中国铁道科学研究院研究生部,北京 100081; 2.中国铁道科学研究院集团有限公司通信信号研究所,北京 100081;3.国家铁路智能运输系统工程技术研究中心,北京 100081; 4.国铁铁道试验中心,北京 100015)

引言

2020年8月,国铁集团发布《新时代交通强国铁路先行规划纲要》[1],要求加大5G通信网络等新型基础设施建设应用,统筹推进新一代移动通信专网建设。在这一背景下,我国铁路系统、科学地开展了5G-R的规划、科研攻关、装备研发、标准制定以及实验验证等工作。规划方面,国铁集团2020年发布规划,围绕贯彻落实党中央关于加快5G网络等新型基础设施建设的决策部署,为加快推进铁路5G技术应用科技攻关工作,促进铁路5G技术应用发展,以保安全、提效率、增效益为目标,统筹规划了未来三年的科技攻关重点工作。科研攻关方面,立项《基于2 100 MHz频率的铁路5G专网技术体系及关键技术研究》系统性重大课题,从电波传播特性、装备研发、承载关键业务、检测技术等方面开展研究工作。装备研发方面,5G-R 13类主体系统及应用装备基本研发完毕,即将进入东郊环线试验评审阶段。标准制定方面,已发布《铁路5G专网业务和功能需求暂行规范》《铁路5G专用移动通信(5G-R)系统需求暂行规范》。实验验证方面,依托《东郊环行铁道5G专用移动通信系统技术试验》课题,已完成试验大纲和动静态试验案例的编制工作,正在开展实验室设备功能、性能以及接口互联测试和试验评审准备工作。

随着后续东郊环线国家铁道试验中心动态试验、现场试验线高速试验、试用考核等工作的稳步、高质量推进[2],5G-R系统的部署和运维将逐步提上日程,未来5G-R将承担更多的铁路业务,成为智能铁路[3]高质量发展的重要支撑平台。其在运行过程中的功能、性能以及可靠性(运用质量)直接关系到铁路运营生产的安全,随着5G-R相关工作的全面推进,有必要提前开展5G-R运用质量评估分析技术的研究。

针对移动通信网络运维相关工作和概念,整理了相关学者的研究成果。王铨等[4]介绍了各级维护管理单位在GSM-R维护工作中的分工及存在问题,阐述了GSM-R全网运维支撑系统的起源及功能目标。王买智等[5]开展了GSM-R网络全网运维支撑系统总体架构设计,提出了设计原则、实现目标,并提出国铁集团、路局两级架构的系统架构方案。杨锐等[6]结合CTCS-3级列控系统无线超时分析阐述了GSM-R网络运行数据综合分析系统的作用。杨锐、郭桂芳等[7]结合5G服务化架构和网络功能虚拟化、切片技术应用等特点,针对铁路5G-R架构,设计了包括网管、服务/切片管理、终端安全、应用商店等模块的2级运维支撑系统架构。综上可知,目前针对5G-R运用质量评估分析的研究甚少,未见对其数据源运用、关键技术及架构设计的描述或分析。

从5G-R运用质量分析数据源研究入手,结合劣化度分析和机器学习理论开展了运用质量评估分析关键技术研究,在归纳总结5G-R运用质量分析的功能需求基础上,基于微服务技术,设计了5G-R运用质量评估系统的架构。

1 5G-R运用质量评估数据源研究

5G-R网络各接口、路测、网管、天线姿态等数据源是网络运用质量评估的重要输入,是运用质量评估、故障预警和故障定位准确与否的基础和关键,也面临着获取难度大的问题。本节对5G-R运用质量DPI、空口、网管北向接口、路测、天线姿态等数据的构成以及获取方式进行了深入分析。

1.1 DPI数据

深度包检测(Deep Packet Inspection,DPI)[8-10]是对5G-R核心网(5GC)的主要接口信令及业务进行采集识别,DPI数据包括生成的相应xDR文件、原始信令文件等。xDR是从CDR(Call Detail Record,呼叫详细记录)延伸的概念和术语,其中x表示任意应用,xDR表示任意应用的详细记录。

采集设备从5G-R网络中获取原始数据,采集接口包括信令面和用户面两类,见表1。

表1 5G-R DPI数据采集接口Tab.1 5G-R DPI Data acquisition interfaces

DPI设备功能结构见图1。并接分流采用分光器实现,分光位置在交换机输入或者输出链路上,分光位置选取的原则是在最少的链路上收敛尽可能全的数据。信令面流量和用户面流量进入汇聚分流器后,信令面根据同源同宿,分流到信令面采集机。用户面根据同源同宿分流到用户面采集机。采集解析设备接收流量后进行协议解析和业务识别,分别输出信令面xDR话单和用户面xDR话单,在“xDR合成”模块进行话单的合成回填,如果有指标统计需求则在“统计分析”模块功能上进行统计和分析。xDR输出后,通过接口服务器上传到应用服务器。

图1 DPI设备功能结构Fig.1 Functional structure of DPI equipment

1.2 空口数据

5G-R系统采用双向鉴权机制,传统类似于GSM-R系统在开放的空口采用第三方设备进行采样监测的技术在5G系统中实现难度大。鉴于此,目前公网运营商采用从5G基站设备取得空口监测数据的方式,能够取得的空口数据见表2。考虑5G-R无线测量和资源管理等方式与5G相同,因此该方式同样适用于5G-R网络。

表2 5G-R空口监测数据Tab.2 5G-R air interface monitoring data

1.3 网管北向接口数据

5G-R系统网管子系统除具有传统的无线配置管理、网管工具操作、性能指标和告警管理功能外,为配合第三方系统掌握5G-R系统的运行状态,网管系统应通过北向接口提供相应的状态数据,主要包括资源数据、性能数据、告警数据三类,网管北向数据见表3。

表3 5G-R网管北向数据Tab.3 5G-R network management northbound data

1.4 路测数据

路测数据是铁路相关部门根据工作计划搭载综合检测列车或者电务检测车,利用通信检测系统采集铁路沿线专用移动通信系统的场强、服务质量以及应用功能检测指标,通过指标是否合格判断网络是否存在异常[11-12]。经研究,5G-R路测系统可提供的数据如表4所示。

表4 5G-R路测数据Tab.4 5G-R field test data

1.5 天线姿态

我国铁路5G-R申请的无线频率资源为2 100 MHz频段2×10 MHz带宽,较GSM-R频段更高,电波传播损耗加大。因此,对于基站天线的姿态更加敏感,天线姿态偏移会直接影响5G-R的无线覆盖,进而影响网络服务质量,传统手工测量的方法无法满足天线姿态测量的实时性和准确度的要求,文献[13]提出的基于视觉、卫星定位技术的一种三维姿态测量方法,可为5G-R基站姿态三位精确姿态测量和姿态变化监测提供技术手段,天线姿态数据也可为5G-R运用质量评估提供数据支撑。

2 5G-R运用质量分析关键技术研究

不同层面的铁路管理和技术人员对于5G-R网络运用质量关注的颗粒度不同。决策层和管理层人员关注网络运行的整体水平便于决策分析,而网络维护技术人员更多地关注网络运行质量变化趋势,便于故障的提前预警以及网络出现异常时的故障点排查。为满足决策和维护等不同人员的关注度需求,可分为2个层次进行评估分析,基于劣化度理论得到5G-R系统的整体运用质量(健康,良好,一般,预警,故障),基于机器学习XGBoost实现网络运用质量的趋势分析和异常的定位。

2.1 基于劣化度的5G-R总体运用质量评估

传统的设备或者系统的劣化度分析是将设备或系统细分为若干个子部件[14],进而建立设备状态评价集,结合各子部件的权重系数,在部件级健康状态评估的基础上按隶属度最大原则,确定设备最终的健康状态。

5G-R系统庞大,其中,目前规划的5GC网元有32个,无线网BBU、RRU分布广泛,采用传统的按部件进行分析的方式存在两个问题,一是部件数量太大,二是各部件状态无法直接获取。本文研究的5种用于运用质量评估的数据源从不同侧面反映5G-R的运用质量,其中DPI数据可反映5GC的各网元间接口信令及业务流状态,空口数据可反映无线侧相关流程及状态,北向接口可以反映整个系统的资源、性能、告警状态,路测数据是以检测指标为抓手反映整个系统的功能、性能以及承载业务能力,天线姿态可以反映天线的俯仰角及方位角是否在合理范围内。提出基于上述5种数据源的健康状态{x1(t),x2(t),x3(t),x4(t),x5(t)}[15],结合各自权重,借助劣化度模糊判断矩阵,评估5G-R网络的整理运用质量的思路。

各数据源劣化度采用公式[16]为

(1)

式中,l为该数据源良好状态;m为该数据源极限状态;s为该数据源当前实际状态;n为常数。

各类数据源在进行整体健康状态判断时的权重按专家打分的方式给出权重矩阵为

W={WDPI,W空口,W北向,W路测,W天线姿态}

(2)

5G-R运用质量整体健康判断结果向量包括5种结果,作为备选判断结果的集合为

S={S健康,S良好,S注意,S恶化,S故障}

(3)

借助模糊数学理论建立评判模糊矩阵为

权重矩阵与判决模糊矩阵相乘即可得到整体运用质量的最大隶属度判断结果为

R整体质量=W×R

(5)

下面进行举例计算。设定五类数据源根据式(1)计算得到的当前劣化度为

K={0.21,0.32,0.22,0.24,0.19}

采用岭形分布计算各健康等级隶属度具有明显优势,公式如下[14]

(6)

(7)

(8)

(9)

(10)

利用式(6)~式(10)计算得到模糊矩阵如下

专家打分给出权重矩阵如下

W={0.3,0.25,0.12,0.25,0.08}

利用式(5)计算整体质量隶属度向量为

{0.004 0, 0.844 7, 0.151 3,0,0}

根据隶属度最大原则,该向量中第二个分量0.844 7最大。因此,此时5G-R系统属于“良好”状态。

2.2 基于机器学习的网络异常检测与故障定位

为满足运维技术人员对于异常检测和故障定位的需求,需研究相应的算法模型。异常检测是通过训练模型来寻找不符合预期行为的数据异常点。由于异常检测是针对小概率事件,且数据集存在极大的非均衡性,因此,需要使用集成学习模型或深度学习模型等鲁棒性相对较高的模型。深度学习模型参数多,需要海量的数据进行训练,且训练周期相对较长,并不适合本文研究的领域。因此,本文选用了在异常检测领域应用较多的集成学习模型XGBoost[17]。XGBoost是一种基于决策树的集成机器学习算法,具有鲁棒性强、准确度高、不容易过拟合等优点[18]。其原理主要是通过多个分类器的结果相加获取最终的预测值,每一次训练的弱分类器用来拟合当前预测值与真实值的残差。其目标函数如下

(11)

通过式(11)计算Lt只要达到最小就可以判定目标函数达到模型收敛。

基于XGBoost的异常检测与故障定位流程见图2。

在周期性模型训练阶段,为提高模型准确率,需充分了解数据特征,因此,有必要先对DPI、空口、网管北向接口、路测、天线姿态这五种数据进行探索性(EDA)数据分析。EDA数据分析主要有以下作用。

(1)查缺补漏,处理数据当中的缺失值。例如在路测时,由于人为因素或设备因素导致数据缺失,使用均值替换的方式弥补缺失值。

(2)分析不同特征的异常相关性,预先判断影响异常检测模型的重要特征,并与实际业务关联,为故障定位提供参考。

(3)多源数据处理后不同特征下的数值数量级差距较大,需要对其进行归一化处理,提高特征纯度。

根据分析结果进行特征工程建模,从而有效地提取数据特征。将数据特征输入XGBoost模型中进行训练,以此得到用于实时预测的异常检测模型和模型针对当前数据给出的特征重要性排序,为网络趋势分析和故障定位提供较为准确的参考依据。

在实时预测阶段,实时数据会以消息队列形式输入。首先系统对实时数据进行预处理,将预处理结果输入预测模型中,预测模型对实时数据进行预测,判断是否出现异常。若模型判断异常,则根据特征重要性依次进行故障预警确认或故障定位,并结合专家经验完成预警或者故障处理。

3 基于微服务的系统架构设计

微服务将应用拆分多个小型服务,每个小型服务有自己的进程,微服务之间采用轻量级机制(API)进行通信。作为一种系统研发和部署方式,微服务具有配置简单、开发快速和易于部署的特点[18]。而5G-R运用质量评估系统结构复杂,采用微服务架构,可大大提升系统的开发效率和可扩展性。

3.1 5G-R运用质量评估功能设计

运用质量评估系统可以实现5G-R网络运用质量的趋势分析以及出现故障时的问题分析和定位,此外结合5G-R专网的特点,运用质量评估系统需要解决的问题包括基于云服务化架构NFV模式下故障网元的定位、端到端切片故障的故障点定位等。归纳功能清单如表5所示。

表5 5G-R运用质量评估功能设计Tab.5 Function design of operation quality evaluation for 5G-R

3.2 运用质量评估系统架构设计

5G-R运用质量评估系统需要满足国铁集团、局集团公司、站段工区等三级业务及管理需要。为更好适应该系统的实际需求,运用质量评估系统把数据收集和处理、业务服务软件架构分开设计。

3.2.1 以业务服务为核心的业务功能架构设计

5G-R运用质量评估系统业务架构分为前端展示层、核心功能层、数据存储层(图3),其中核心功能层采用SpringCloud微服务架构[19],国铁集团和各铁路局根据需要可独立部署公共功能,也可根据国铁集团和各铁路局的个性化需求,单独订制开发个性化功能。同时,国铁集团和各路局之间在完成安全认证下可实现数据的共享。站段工区隶属于铁路局,通过路局系统的角色定义,实现自己的业务功能。

图3 业务功能架构Fig.3 Service and function architecture

业务架构的数据功能是通过调用大数据平台的API完成数据分析、订阅、共享。

运用质量评估系统的核心功能包括总体评价、故障预警、故障定位、辅助功能均拆分的独立微服务,可单独开发和部署。其中总体评价和故障预警、定位采用第2章中设计的算法和流程。各服务通过Eureka注册中心完成服务注册和发现,通过Feign实现远程服务调用,借助Ribbon完成服务调用的负载均衡,通过Hystrix实现分布式服务的熔断器,保证服务调用失败时不会出现整体服务故障,避免服务雪崩,提高系统的弹性和可靠性。

3.2.2 以数据服务为核心的数据平台架构设计

运用质量评估系统大数据架构[20]分为数据收集层、数据存储层、数据分析层、数据中台层,如图4所示。

图4 大数据平台软件架构Fig.4 Software architecture of Big-data platform

数据收集层对DPI数据、空口数据、网管北向数据、路测数据、天线姿态数据收集,对数据分成实时数据和批量上传数据,分别进行数据清理、校验。

数据存储层分为批量数据和实时数据,批量数据为非实时数据,直接存储在HDFS分布式文件系统中。实时数据通过Kafka分布式消息系统处理,存入HBase或数据缓存中。

数据分析层利用大数据处理的各种算法,进行数据查询、分析和处理。

数据中台层完成数据平台的数据管理、集群配置、租户管理、安全管理等功能。

数据平台架构设计充分考虑了业务功能架构需求,并在数据分析层嵌入了本文提出的劣化度和机器学习等相关算法,实现了整个铁路5G-R运用质量评估系统架构的数据底座。

4 结语

5G-R网络作为我国智能铁路架构中“智能传输层”的重要组成部分,其泛在互联和可靠传递属性的实现直接关系到智能铁路的高质量发展,将在我国智能铁路体系架构2.0中发挥重要作用,而5G-R运用质量评估技术的研究,有利于更好地提升5G-R系统的运用、维护技术水平。针对铁路5G-R运用质量评估开展研究,主要结论如下。

(1)深度剖析了作为评估输入的DPI、空口、NMS北向接口、路测、天线姿态等主要数据构成和特点,并对各类数据的获取方式进行了介绍。

(2)为满足不同层面的铁路通信管理和维护人员的需求,分层对5G-R运用质量进行评估。一方面针对管理层对5G-R健康状态整体把控的需求,利用劣化度理论提出了5G-R整体运用质量的评估算法;另一方面针对运维技术人员对于网络运行趋势分析和故障定位的需求,利用机器学习算法,结合本文提出的多源数据,提出了相应分析流程。

(3)对5G-R运用质量评估系统进行功能设计,充分考虑了5G-R基于云服务化架构NFV模式下故障网元的定位、端到端切片故障的故障点定位等需求并进行了功能设计。系统架构方面的工作主要包括基于大数据的数据清洗、存储、分析、配置以及基于Spring Cloud微服务的业务核心功能模块设计。

后续可进一步完善相关算法,用于5G-R运维支撑系统的研发,与此同时,也可在目前的装备研发阶段对5G-R系统装备厂家提出相应北向接口运维数据配合需求,提前布局,保障后续研发的顺利进行。

猜你喜欢
数据源架构评估
基于FPGA的RNN硬件加速架构
功能架构在电子电气架构开发中的应用和实践
Web 大数据系统数据源选择*
LSN DCI EVPN VxLAN组网架构研究及实现
基于不同网络数据源的期刊评价研究
评估依据
基于真值发现的冲突数据源质量评价算法
一种基于FPGA+ARM架构的μPMU实现
立法后评估:且行且尽善
分布式异构数据源标准化查询设计与实现