一种基于深度学习的改进萤火虫频谱分配算法

2020-05-22 07:13苏慧慧曲文博

陕西理工大学学报(自然科学版) 2020年2期

苏慧慧，彭艺，曲文博

(昆明理工大学信息工程与自动化学院，云南昆明 650500)

认知无线电(Cognitive Radio，CR)[1]深入人心是起源于Mitola博士，他在1999年将认知无线电从无线通信以及不同学科的角度提出了拓展概念，而通信角度的定义由Haykin[2]提出,他同时定义了无线通信系统。频谱分配作为认知无线电的重要技术，所用到的系统模型主要有拍卖模型[3]、博弈论模型[4]和图论模型[5]。在图论频谱分配模型的基础上以网络总效益和用户公平性为目标函数进行寻优。目前，针对频谱分配问题的研究中，遗传算法(Ganetic Algorithm，GA)、粒子群算法(Particle Swarm Optimization，PSO)、离散人工蜂群算法[6](Discrete Artificial Bee Colony，DABC)等智能算法被不断地引入解决该问题的方案[7-8]，不过当目标维度不断加大时上述算法收敛速度明显下降，因此针对该问题更高效的启发式优化算法是目前的研究重点。

萤火虫算法(Firefly Algorithm，FA)是目前广泛研究的优化算法之一，在算法上的改进研究虽有所优化，但是将其利用到频谱分配领域中仍有很大的提升空间。Wang等[9]提出了随机吸引模型，增加了种群随机性以避免局部最优问题，仿真收敛效果好，但造成时间复杂度较高。Verma等[10]提出基于维度不同构造一只全局最优的萤火虫FGbest以指导算法整体优化方向，但仿真后期收敛较慢。Zhang等[11]在Verma研究基础上根据最大回报成本比选择全局最优FGbest。近年来国外不少学者将研究的问题与智能算法结合，这些方法对算法性能的提升表现出显著效果，其中较突出的为源于人工神经网络[12]的深度学习，其实质是对最初的数据及信息进行特征点的提取，并对之后的变化趋势进行一定的预测[13],这对于数据的处理以及算法复杂度的优化具有正向相关的作用。

针对以上问题，本文提出了在图论模型的基础上将萤火虫算法进行改进，首先将步长调整为适时步长，避免了当步长不当导致搜索精确度存在较大的误差以及搜索速度降低的缺陷；其次，在萤火虫的寻优过程中对移动位置进行了一定的优化调整，采用移动变化规则移动会节省资源，降低搜索的复杂度；为了快速寻优，将深度学习引入中心粒子的搜索过程，进行一定次数的深度学习，学习后的粒子引导种群进化，提升寻优性能。

1 系统模型

1.1 图论频谱分配模型

用户允许使用的频率资源可以等效为色数，被占用信道的临近范围的其他用户无权接入该信道，并且为了避免干扰产生，该被占用信道即使被释放也不会被同类用户接入使用。因此在把此种干扰情况等效为一条边，应用图论着色模型能很好地简化问题，便于仿真研究，认知无线电网络拓扑模型如图1所示。

图1 认知无线电网络拓扑模型

具体定义如下[14]：

(1)在需要分配的认知无线电网络中，存在N个认知用户竞争M个频谱。

(2)令矩阵L={ln,m|ln,m∈{0,1}}N×M表示空闲频谱,其中ln,m=0表示用户n不可以使用m频段。

(3)效益矩阵B={bn,m}N×M表示认知用户n使用频谱m的情况下所获得的效益。

(4)干扰矩阵C={cn,k,m|cn,k,m={0,1}}N×N×M，cn,k,m=1表示用户n,k共同使用频谱m时产生的干扰。

(5)频谱分配矩阵A={an,m|an,m={0,1}}N×M，an,m=1表示频谱m分配给认知用户n。A满足的条件：an,m·ak,m=0，如果cn,k=1,∀n,k

由上述可知，每个认知用户所获得效益为rn=an,m·bn,m，其网络总效益MNE(Maximize Network Efficiency)公式表示为

网络平均效益公式为

设式(2)的倒数为初始化时萤火虫的荧光素值：

1.2 频谱分配矩阵描述

假设通信环境改变的时长与频谱分配所需时间相比可忽略不计，每只萤火虫对应一种频谱分配方式，确定认知用户数和频谱数并进行频谱检测之后得到可用矩阵L，在可用矩阵中针对非0元素的位置编码为萤火虫Xi(t)的位置信息,以图1为例，即:

用户： 1 2 3 4 5

再将平均最大化网络效益转化为萤火虫的亮度函数，寻优求解，问题维数为N×M，所以在N和M数值增加时会使得建模的维数骤然增加。

2 基于改进萤火虫的频谱分配算法

2.1 基本萤火虫算法

基本萤火虫算法中，选取N只萤火虫随机分布在被搜索的领域内，具体领域定义为{X1(t),X2(t),…,Xn(t)}，在d维空间内，萤火虫i的位置为Xi(t)={Xi1(t),Xi2(t),…,Xid(t)}。

(1)荧光素亮度

(2)荧光素更新阶段

Ii(t+1)=(1-ρ)Ii(t),

(5)

式中ρ∈(0,1)为荧光素变化率。

(3)位置更新阶段

在萤火虫i向萤火虫j移动的时候，更新后的空间坐标为

更新后的距离公式为

其中固定移动步长用f表示；‖·‖是萤火虫i、j之间的欧式距离；I0表示萤火虫初始亮度值；γ为光吸引系数；xid为第i个萤火虫位置的第d维变量，d∈(1,2,…,D)。

2.2 适时变化步长

在萤火虫算法中步长的取值是运行速度和精度的决定性因素，通常算法中都给予定值，但是步长过大全局搜索效果虽好但是却影响结果的精度值，步长过小求解精度虽高但是搜索范围以及搜索精度却不是理想状态，故针对算法的不同阶段应动态的准确调整步长大小，达到精度与全局优化的平衡。综上，在改进萤火虫算法中，将固定步长f调整为自适应搜索步长s(t)，经过调整之后为

式中δi为自适应协调因子，Xmax、Xmin为此次迭代中荧光素最大和最小的萤火虫所在的空间位置，smean、smax、smin分别表示平均、最大、最小的移动步长，t为本次迭代次数，tmax为最大的迭代次数。

在步长适时调整中，处于萤火虫迭代早期，δi随距离而单调递增，公式(7)移动步长初期值较大，移动步长用较大值加速收敛，促使萤火虫种群往最优值附近移动；寻优后期趋于稳定时，随着迭代次数的增加，公式(7)的值会相应的减小至固定极小值，防止萤火虫因步长过大跳过最优值点出现震荡现象。

2.3 移动变化规则

在萤火虫算法中，当萤火虫长时间进行寻优求解但搜索范围并未扩大时会使得寻优精度不佳，处于局部最优的状态，此时，适应度函数不再变化，萤火虫的亮度也趋于无法区分的阶段。为减少复杂度，在萤火虫搜索范围内发现萤火虫i与j的亮度接近时，此时为了跳出局部最优，萤火虫i可以选择随机移动，具体移动的规则如图2所示。从萤火虫i的d维元素中随机抽取第k维元素Xi,k，再将该元素随机插入剩余(d-1)维元素的随机维，其思想可以看作是遗传算法中的变异，更新为新的萤火虫i′再次与萤火虫j比较亮度，比较适应度值的大小，如果更亮于萤火虫i则该萤火虫被淘汰，否则保留[15]。

图2 亮度相同时随机移动示意图

2.4 基于深度学习的双中心粒子群寻优

双中心粒子群[16]是在普通粒子群[17]的基础上进行改进的，构造广义中心粒子对其进行一定次数单维深度学习，用学习后的广义中心粒子引导种群进化。优化问题中目标因子被看成“粒子”，每个粒子都有对应的适应度值。初始化时为群随机粒子，通过迭代不断寻优。每一次迭代，粒子需要计算两个极值，并通过两个极值更新自己，个体极值PBest(粒子本身的最优解)和全局极值GBest(整个种群目前的最优解)。中心粒子的位置公式可以表示为

图3 RBF神经网络结构分解图

RBF神经网络基本思想是通过基函数投影的方式，完成低维空间到高维空间、非线性到线性的关系转变。训练方法快速易行，自学习和容错性能理想，设计三层基于适应度的反向传播神经网络，输入层由i个d维的萤火虫作为i×d个输入神经元构成，隐层的单元数由输入层神经元个数决定，输出层输出由隐层加权得到的d维广义中心粒子，添加适应度计算函数以得出神经网络预测结果的适应度值，设置神经网络反向传播损失函数为预测值与上述适应度值残差的平方和。RBF神经网络结构如图3所示。将深度学习的思想应用在上述中心粒子的寻优过程中，具体如下：

(2)将i个d维萤火虫输入神经网络。

(3)在迭代(Iteration)D_iter次后，获得粒子优化输出

2.5 频谱分配算法流程

基于上述系统模型研究频谱分配方案，算法具体流程如下所示。

输入：矩阵A、B、C以及相关参数。

输出：最佳位置Xi。

(1)初始化萤火虫种群，设置相关参数:频谱效益矩阵由萤火虫随机初始位置得出;无干扰矩阵由随机产生的二元对称矩阵得出;萤火虫荧光素值初始化时以公式(3)为标准得出。

(2)根据公式(4)计算和评价萤火虫亮度。

(3)根据移动变化规则对种群进行移动，产生新的个体融入，结合公式(6)和公式(8)对萤火虫的位置更新。

(4)构造中心粒子：根据公式(10)构建中心粒子，并利用公式(11)对广义中心粒子进行D_iter次深度学习。

(6)检验是否达到最大迭代次数，若达到则停止迭代，输出全局最优位置，否则转(3)。

3 仿真实验

本文在进行仿真之前首先对所需参数进行设置：萤火虫的个数N为30，频道数M为5，光吸引系数γ为0.5,初始荧光素I0为5，最小步长smin为0.01，最大步长smax为1，平均步长smean为0.53，荧光素变化率ρ为0.37，最大迭代次数tmax为200，领域半径为10。人工蜂群算法的环境也与之相同。

验证算法的可行性时，独立实验完成20次后从图4中可以看出，将人工蜂群算法、基本的萤火虫算法和改进后的算法对比，改进后的萤火虫算法曲线最先靠近X轴，FA算法在40～60之间有些许波动，表明在这个区间范围的迭代次数上会出现局部最优，寻优效率会降低，而改进后的算法在迭代次数20左右便已经快速接近X轴，便于快速找到局部最优解。

图5以网络总效益为目标函数进行仿真，认知用户数为20，频谱数为5，从图中可以看出，改进后的IFA算法波动程度较小，与其他算法相比较为稳定。

图4 不同算法的寻优变化曲线图5 不同算法的网络总效益

如图6所示，在频谱数为定量5，认知用户数为变量不断递增时，所提算法的平均总效益不仅稳定而且更优。同样的，当认知用户为定量20，频谱数为变量时，从图7中可以看出与预期结果一致。

4 结论

根据目前认知的无线电频谱分配常用模型的特点以及所用算法的编码特质，应用图论模型解决该领域的频谱分配问题，在萤火虫算法的基础上，将萤火虫的移动变化规则进行了一定的调整，在扰动的同时增加了种群的多样性。此外，将神经网络的思想应用于双中心粒子群搜索过程中，根据该模式下的寻优结果，使得寻优结果精度得到提高，将深度学习的部分思想使用在改进的频谱算法中，整体的复杂度虽略有变高，但寻优精度和性能的稳定、优越性都有了明显的提高。

图6 认知用户数变化时的平均网络总效益图7 频谱数变化时的平均网络总效益