基于集成学习的广域光骨干网多信道传输质量预测方法

2020-10-11 03:07孙晓川李志刚张明辉桂冠

通信学报 2020年9期

孙晓川，李志刚，张明辉，桂冠

（1.南京邮电大学通信与信息工程学院，江苏南京 210003；2.华北理工大学人工智能学院，河北唐山 063210；3.河北工业大学电子信息工程学院，天津 300401）

1 引言

第5代移动通信系统（5G）的飞速发展[1-3]不断促进云计算、远程教育、智能城市、自动驾驶等高端需求的进一步发展，使终端用户数量、网络业务量和数据流量快速增长，支撑数字通信基础设施的广域光骨干网面临严峻的挑战[4]。全球范围内，骨干网干线采用的都是光通信传输模式。为满足未来400 Gbit/s速率的传输要求，构建高带宽、大容量、快速响应的智能全光网势在必行[5]。根据信道状态、系统资源和用户业务需求，未来智能光网络应能够自适应地调整信号速率、调制格式、波长等参数，实现骨干网资源的最大化利用。作为未来智能光网络的核心技术，系统性能参数的监控、识别和预警，尤其是光信道性能分析与预测，是保障高速骨干网通信质量不可或缺的重要组成部分。

众所周知，骨干网络的光层特性决定了网络承载流量的效率。光信道传输质量（QoT,quality of transmission）极易受色度色散、偏振模色散、光纤非线性、噪声等多种损伤参数的影响[6-7]。这些因素的波动会导致光信道传输的突发性、空间异质性和复杂的非线性关系，从而给高容量、大带宽、快响应的骨干网可靠通信带来巨大的挑战。通常，质量因子（Q因子）是衡量光信道传输质量最具代表性的度量标准之一。

高效的光通信质量预测对管理大规模的光传输和交换系统非常重要[8]。这是因为未来光骨干网络将是一种具备动态重构和链路级恢复功能的网状网络，技术更复杂，极易受到网络故障、错误配置、信号质量恶化等因素的影响[9]。具体地，一个短暂的服务中断会影响大量的数据通信，且随着信道数、数据传送速率以及通信距离增大，光网络对非线性效应更敏感。

近年来，机器学习（ML,machine learning）在骨干网通信中的应用已成为研究热点，特别是在光信道性能预测方面，主要包括支持向量机、随机森林、决策树和神经网络等[10-12]。目前，关于光信道性能预测的绝大多数研究都集中于单信道模式，这显然无法为光网络管控的智能化决策提供更准确的信息。而利用多信道性能预测辅助光网络智能化管控的研究很少。文献[13]研究了基于人工神经网络（ANN,artificial neural network）的多信道Q因子预测方法，利用实时网络运行和配置信息，在563.4 km的模拟实验平台上进行了不同信道开关模式下的Q因子预测。但该方法在处理多信道QoT预测问题时受到两方面制约：1)单一ANN模型实质上是弱学习器，很难得到期望的预测结果，大量研究表明，通过某种策略联合多个学习器，性能会显著优于单个学习器[14]；2)模拟光通信数据严重影响了ANN在实际光信道QoT评估中的有效性，而商用光网络的真实数据更能反映光信道的不确定性和未知因素，更有助于构建一个有效而精确的ML模型。

集成学习（EL,ensemble learning）是一种应用广泛的机器学习优化方法，可以将弱预测器集成组合为强预测器，提高算法的非线性逼近性能[15]。具体地，集成学习分别对多个单一学习器（同质/异质）进行训练，按照某种策略对学习结果进行整合，从而找到每个学习器之间的互补性，获得更加优秀的性能。一方面，集成学习中的结合策略可以减轻由于特征不相关和冗余而产生的剩余效应；另一方面，多个独立模型学习能力的变化使它们能够捕获不同的数据特征，为整合结果提供了附加价值[16]。利用这些优势，集成学习模型可以获得比模型中任何独立模型更好的预测性能。目前，集成学习算法主要包括Bagging算法、Boosting算法和Stacking算法[17]。其中，Stacking算法常用于提升机器学习模型的预测性能。鉴于此，本文将探索基于Stacking的集成学习模型在光信道QoT预测中的可行性。

本文提出了一种基于集成学习的新型广域光骨干网络多信道QoT预测方法。结构上，该模型由5个多层感知机（MLP,multilayer perceptron）组成的基预测器和一个MLP组成的元预测器堆栈而成。训练模式上，分别训练基预测器中的MLP，整合其预测结果作为元预测器的输入进行二次训练，最终的结果兼顾多个预测模型的学习能力。实验结果表明，集成多个学习器使光信道QoT预测方法的泛化性能更强和可移植性更优，避免了单一学习器的预测精度不足，分散了预测误差的风险，提高了光信道性能预测的可靠性。

2 基于集成学习的光信道QoT预测模型

本文构建了基于Stacking算法的广域光骨干网多信道QoT预测模型，简称为EL-MLP。特别地，考虑Q因子作为信道通信质量的度量标准。结构上，基于EL-MLP的Q因子预测模型由数据选取、参数寻优和模型构建3个模块构成，如图1所示。受数据采集设备和不可控因素的影响，每个信道中的Q因子数据量存在差异，通过数据选取模块，在单信道和多信道情况下选出等量的样本数据集，并根据多信道选择模式确定信道状态，确保后续的模型训练在相同数据量和相同多信道场景下进行。采用参数寻优模块从所有备选参数中筛选出对预测器预测性能最有利的参数设置（如迭代次数、学习速率），输入模型构建模块，确定最优的EL-MLP预测模型。本文采用格式搜索的方法。

图1 基于EL-MLP的Q因子预测模型

2.1 信道选择模式

在多信道预测的信道选择中，设置4种打开或关闭的信道状态以生成4种不同的场景[13]。此外，设置包含信道状态和Q因子特征的组合向量V来有效地表达每一条信道中Q因子的状态。假设第1、第3、第5信道处于打开状态，[1,0,1,0,1,0,0,0]表示当前所有信道的状态，其中，“1”表示对应信道已被光网络信号占用，“0”表示对应信道为开放频谱信道。8个信道的相关Q因子特征λi(i=1,2,…,8)与信道状态的组合向量为

根据组合向量，对处于信道关闭状态的Q因子进行预测。一方面为处于打开状态的信道减少负荷；另一方面为已接收的网络流量分配合理的信道空间，避免出现负载过高、负载不平衡的现象。

2.2 训练方法

MLP模型可以通过学习样本集建立输入与输出之间的非线性映射。MLP模型的参数少且结构简单，可以快速准确地处理Q因子时间序列数据之间的非线性关系[18]，因此本文选用MLP作为基预测器和元预测器的组件。

EL-MLP训练实际上是利用初始训练集训练出最优的基学习器，然后对基学习器中的所有MLP的输出结果叠加取平均，生成一个新数据集，用于训练元学习器。通常，MLP通过误差反向传播方法进行训练。首先进行前向传播计算，任意一层神经元对应的输出为

MLP训练的目的是通过最小化损失函数来确定最优的权重矩阵和偏置。假设MLP网络的最后一层为第k层，则损失函数为

其中，Lk表示第k层的所有神经元，表示第k层第j个节点的预测值，表示第k层第j个节点的真实值。权重矩阵和偏置的迭代方程如下。

其中，η为学习速率。更新权重矩阵和偏置，直到损失函数达到指定范围或迭代次数大于最大迭代次数，MLP训练结束。EL-MLP训练算法伪代码如算法1所示。

3 仿真实验与性能分析

本节首先介绍了实验所采用的数据集、模型性能评估标准和模型参数选择。然后利用集成学习模型EL-MLP对单信道内Q因子数据进行预测评估。最后建立了同时预测多信道内Q因子的EL-MLP模型，并分别在4种不同场景下进行了对比，检验了模型的预测精度及泛化能力。

3.1 数据集及性能评价标准

本文综合评估了在单一光信道和多种场景下不同光信道中EL-MLP模型对QoT的预测性能。特别地，采用Q因子作为光信道QoT的度量标准。本文所使用的数据集来源于2015年2月到2016年4月微软北美光骨干网，广泛应用于研究光信道的时间行为、信号质量、信道之间的相关性、段之间的相关性等[9]。此外，选取了8种光信道Q因子时间序列数据作为样本集，序列长度为20 000。

为进一步验证该模型良好的非线性逼近性能，考虑了多层ANN进行性能对比[13]，实际上，这是一个深度神经网络结构。此外，本文采用均方误差（MSE,mean square error）和平均绝对值误差（MAE,mean absolute error）评估模型的预测性能。

其中，yi表示Q因子真实值，yp表示其预测值，N表示时间序列长度。实验中，MSE和MAE的值越小，表明该模型对Q因子的预测精度越高，模型预测性能越好。

本文采用的EL-MLP第一层基预测器由5个结构相同的MLP模型构成，第二层元预测器由一个MLP模型构成。MLP结构包括一个输入层、一个输出层和2个隐藏层，每一层神经元规模设置为(6,6,6,6)。此外，本文使用网格搜索方法和五折交叉验证方法对EL-MLP的迭代次数和学习速率进行优化。首先，确定迭代次数E和学习速率η的取值范围，即E∈{1,51,101,151,201}，η∈{1×10-4,2×10-4,3×10-4,4×10-4,5×10-4}。然后，在取值范围内构建5×5的网格，从第一个网格(E1,η1)开始，遍历网格中所有参数对并进行五折交叉验证，求得所有的MSE如表1所示。其中，最小MSE对应的参数组合是最优的。

表1 模型参数设置

3.2 单信道QoT预测性能分析

图2给出了EL-MLP和ANN针对单信道模式Q因子时间序列的预测趋势对比。从图2可以看出，EL-MLP可以更有效地拟合Q因子序列的变化趋势，这意味着该模型具有更好的预测性能。图3给出了不同时间步下评估模型对单信道模式Q因子的预测误差对比。显然，在大部分区域，EL-MLP的误差值明显低于ANN的误差值。

表2从MAE和MSE这2个方面对比了EL-MLP和ANN的单信道模式QoT预测性能。从表2可以看出，在该度量标准下，EL-MLP对Q因子时间序列的非线性逼近性能优于ANN一个数量级以上。

图2 单信道模式Q因子时间序列预测趋势对比

图3 单信道模式Q因子预测误差对比

表2 单信道模式模型QoT预测性能对比

3.3 多信道QoT预测性能分析

本节考虑4种应用场景，构建了多输入多输出EL-MLP模型，同时对多个光信道通信质量进行预测。具体地，场景1中，光信道3处于开启状态，利用EL-MLP与ANN预测另外7个光信道中的Q因子值。场景2中，光信道1、2处于开启状态，预测剩余6个光信道的Q因子值。场景3中，光信道1、3和5处于开启状态，预测剩余5个光信道的Q因子值。场景4中，光信道1、3、5和7处于开启状态，预测剩余4个光信道的Q因子值。

图4对比了4种应用场景下评估模型对光信道Q因子的预测性能，即不同光信道Q因子预测值与实际值的对比。与ANN相比，EL-MLP的Q因子预测值更接近实际值。表3给出了不同的多信道QoT预测场景下评估模型的预测性能。特别地，针对MSE性能度量，EL-MLP的预测性能比ANN提高了2个数量级。

图4 不同应用场景下评估模型对于各信道Q因子预测性能比较

表3 多信道模式下模型预测性能对比

为了验证EL-MLP的预测性能，本文针对光信道8在4种场景下的Q因子预测值进行了分析，如图5所示。在不同场景模式中，EL-MLP依然可以更有效地拟合Q因子时间序列的变化趋势。这些结果说明在多信道QoT预测任务中所提模型具有更好的预测性能与泛化能力。

综上所述，相比单一的机器学习模型，采用集成学习方法对光骨干网QoT预测更有效。这是因为集成学习组合多个同态学习器进行光信道QoT预测，不仅能够有效缓解单一学习器的过拟合问题，而且可以显著减小因参数选择不准确而引起预测精度降低的风险，极大地提高了算法的泛化性能。

4 结束语

作为未来智能光网络的核心技术，系统性能参数的监控、识别和预警，尤其是光信道性能分析与预测，是保障高速骨干网通信质量不可或缺的重要组成部分。本文研究了目前光信道QoT预测的机器学习方法，分析了单一预测模型存在的瓶颈问题和集成学习理论的优势，提出了一种基于集成学习的广域光骨干网QoT预测方法，实现了针对不同光信道QoT的有效预测，突破了现有解决方案在预测精度上的局限性。通过与深度计算模型的对比实验发现，所提方法能够极大地提高衡量光通信质量的Q因子的预测精度（至少一个数量级）。实际上，光信道传输质量不同程度地依赖多种损失参数，为进一步提高QoT预测的准确性，在未来的工作中拟研究在集成学习框架下多参数融合的多信道性能预测方法。

图5 不同应用场景下光信道8中Q因子预测趋势对比