基于PSO与ELM组合算法的装备器材消耗预测模型

2022-03-24 12:16张东东
关键词:维数适应度器材

刘 畅,伍 洁,肖 斌,张东东

(1.海军工程大学 管理工程与装备经济系,湖北 武汉 430033;2.武警第二机动总队,福建 福州 350200)

维修器材是指用于装备维修所需要的零部件、元器件、附件、原材料及耗材的总称,包括装备购置费购买的随装器材和维修管理费购买、修复、研制和维修的器材[1]。目前,国内外学者对消耗性器材备件预测方法进行了大量探索,如BP神经网络、卡尔曼滤波、支持向量机和极端学习机等。BP神经网络考虑了数据序列的非线性,但收敛速度慢,容易出现网络结构确定不方便、过学习、欠学习、局部极小等问题[2];卡尔曼滤波使用前一点的预测值和当前值更新状态变量的估量,该方法的前提是假定噪声的统计特性已知,但这也正是其难点所在[3];支持向量机法在处理小样本回归问题时能较好地解决非线性问题,但核函数及惩罚系数等参数对支持向量机的预测结果影响较大,且训练集大时,运算耗时长[4]。与传统的基于梯度下降寻优的算法相比,极限学习机(extreme learning machine,ELM)的训练速度更快,可以节省网络参数的调整时间,学习效率较高。

目前,粒子群算法与极限学习机组合算法(PSO-ELM)在二氧化碳排放[5]、太阳能光伏发电[6]和原油期货价格[7]等领域显示了优异的预测性能,但尚无PSO-ELM用于器材消耗预测的研究。由于器材消耗量序列的非线性、非平稳性,笔者利用PSO优化后的ELM具有的强泛化能力和非线性的表征能力,通过3种非线性、非平稳数据集测试及器材消耗数据的预测分析,验证了PSO-ELM的预测精度优于EMD-GA-BP、LSSVM、PSO-LSSVM、ELM模型。

1 极限学习机算法

ELM由HUANG等[8]提出,是一种单隐含层前馈神经网络。若训练样本R={(xj,tj)|j=1,2,…,N;xj∈Rn,tj∈Rm},则极限学习机的算法可以表示为:

(1)

式中:ai=[ai1,ai2,…,ain]T为隐藏层与输入层之间的连接权值;bi为隐含层第i个节点的偏置,i=,1,2,…,L;βi=[β1i,β2i,…,βmi]T为隐含层第i个节点与输出层节点的权值;xj为输入值;tj为输出值;L为隐藏层节点数;N为样本数量。

式(1)可简化为:

Hβ=T

(2)

式中:H为隐藏层输出矩阵;T为样本输出;β为输出层权值。

计算隐藏层输出矩阵,即:

(3)

通过式(2)和式(3)计算输出层权值β:

(4)

其中,H+为H的Moore-Penrose广义逆。

将测试集代入式(3)计算隐藏层输出矩阵H,结合式(2)和式(4)计算测试集输出值:

(5)

E(W)为期望与实际值的误差平方和,搜索最优权值W=(a,b,β)使代价函数E(W)最小,可表示为:

(6)

其中,εj=[εj1,εj2,…,εjm]为第j个样本的误差。

2 粒子群算法

PSO算法在初始化时,粒子被随机给予一个位置和速度,不同个体代表不同的随机解,迭代后最终得到粒子最优解。D维空间中第i个粒子的速度为Vi=[vi1,vi2,…,viD],位置为Xi=[xi1,xi2,…,xiD]。跟踪个体极值Pb、种群极值Gb迭代更新位置,并根据式(7)和式(8)更新粒子的速度、位置。

vij(t+1)=w·vij(t)+c1r1[Pij-xij(t)]+

c2r2[Gj-xij(t)]

(7)

xij(t+1)=xij(t)+vij(t+1)

(8)

式中:c1、c2分别为个体学习因子、社会学习因子;r1、r2为[0,1]区间的随机数;w为惯性因子,调整w对寻优性能作出调整。

参数设置如下:①惯性权重。w较大便于全局寻优,较小便于局部寻优。为了平衡优化过程,采用线性递减权重。取迭代次数为20,wmin=0.4,wmax=0.8。②学习因子。标准PSO中,c1=c2,即粒子转移到两个不同位置的概率相同,未考虑每个粒子各阶段的搜索重点。相对非线性配对发现,c1+c2≤4时,利于ELM预测,故令c1=2.4,c2=1.6。③粒子速度和位置。为避免寻优发散,粒子速度、位置通常设在一定区域内。因粒子由ELM网络连接,故将粒子速度、位置设为[-1,1]。④ELM参数。训练误差目标为0.001,输入为1,输出为1,隐含层为30,激活函数选择Sig函数。

3 PSO-ELM预测模型的算法步骤

将学习样本输出、实际输出的均方误差作为PSO的适应度。比较目前适应度与最优适应度,若目前适应度相对较小,则将目前适应度更新为最优适应度,目前位置更新为Pb,否则保持最优适应度不变。同样,比较适应度、全局适应度,更新Gb。直到迭代达最大次数或适应度达设定值。算法具体步骤如下:①标准化样本数据,建立训练集、测试集;②输入输出数据确定网络结构;③初始化粒子数、空间维数、惯性参数w、学习因子c1与c2、迭代次数、最大速度vmax;④将构建的训练集输入ELM,根据式(9)计算个体的适应度,寻找个体和全局最优粒子的位置和最优值;⑤按照式(7)和式(8)更新粒子速度和位置;⑥重新计算适应度并更新位置和速度;⑦PSO优化得到ELM最优参数ai、βi、bi后,代入ELM模型中进行预测。⑧结果评价值计算。

(9)

PSO-ELM算法流程图如图1所示。

图1 PSO-ELM算法流程图

4 模型结果评估

采用平均绝对误差(mean absolute error,MAE)、均方根误差(root mean square error,RMSE)、平均绝对百分比误差(mean absolute percentage error,MAPE)作为评价指标。

(10)

(11)

(12)

5 仿真对比分析

5.1 数据选取

由于股票指数具有非线性波动的特点,在股票指数原有趋向出现反转时,时间序列模型不便预测,ELM给股票预测带来了新的方法。选取上证指数(000001)、深证成指(399001)、沪深300(399300)非线性非平稳性的收盘价作为数据集1,测试模型的预测性能。数据集1包括2018年3月20日—2021年1月29日700个数据(前600个用于训练,后100个用于测试),数据来自WIND数据库,实证过程基于Eviews11和Matlab2019a完成,具体数据如表1所示。

表1 股票收盘价数据

(1)上证指数:使用文献[9]中的BDS(brock dechert & scheinkman)检验,标准差为0.003 3、0.005 2、0.006 1、0.006 2、0.006 4,嵌入维数范围为2~6,标准差为0.003 3,当维数为2时统计值最小(56.210 6),但5%显著性水平下仍大于临界值1.96,95%的置信水平下是非线性的;使用ADF(augmented dickey-fuller)检验时,t统计量为-1.278 1,大于5%显著性水平下的临界值-1.942 2,95%的置信水平下是非平稳的。

(2)深证成指:使用BDS检验时,标准差分别为0.003 4、0.005 4、0.006 3、0.006 4、0.006 6,嵌入维数范围为2~6,标准差为0.003 4,当维数为2时统计值最小(55.494 6),但5%显著性水平下仍大于临界值1.96,95%的置信水平下是非线性的;使用ADF检验时,t统计量为-1.278 1,大于5%显著性水平下的临界值-1.942 2,95%的置信水平下是非平稳的。

(3)沪深300:使用BDS检验时,标准差分别为0.003 1、0.004 8、0.005 7、0.005 9,嵌入维数范围为2~6,标准差为0.003 1,当维数为2时统计值最小(59.977 2),但5%显著性水平下仍大于临界值1.96,95%的置信水平下是非线性的;使用ADF检验时,t统计量为-1.530 1,大于5%显著性水平下的临界值-1.942 2,95%的置信水平下是非平稳的。

以某装备器材消耗量序列作为数据集2,开展应用分析,以月为单位,共获取120个月的统计数据,如图2所示。由图2可知,器材消耗量数据具备非线性非平稳特征的数据集,异常值较多,具有明显的周期性特点。

图2 原始器材消耗量序列图

5.2 消耗量原始序列特征判别

随着多样化军事任务的频率和强度不断增加,加之经济环境的动态变化,装备器材的消耗会受到各种内外部因素的影响,这些影响的显性表现是多种多样的。现代改装、各种培训、等级修理、供需弹性不足、经济环境剧烈波动,使消耗序列结构发生突变。上述因素在不同时期的影响是非线性和非平稳的,使得传统预测和决策模型的适应性变差,分析更加困难[10-11]。

ADF检验显示,计算得出在1%、5%和10%显著性水平下的临界值分别为-2.586 6、-1.943 8、-1.614 8,统计量为2.264 7,P值为0.994 3,表明消耗量序列是非平稳的,序列中可能包括趋势、季节性或周期性成分,符合装备器材故障的一般规律以及计划消耗与临时任务消耗相结合的实际。

BDS检验显示,标准差为0.004 7、0.007 3、0.008 3、0.008 6、0.008 8,嵌入维数范围为2~6,当维数为4时统计值最小(6.360 9),大于显著性水平5%时的临界值1.96,说明消耗量序列是非线性的,验证了消耗受到多重因素的共同作用,存在着复杂的非线性关系。

5.3 模型预测结果比较

为了评价所提出组合模型的优越性,将结果与EMD-GA-BP[12]、LSSVM[13]、PSO-LSSVM[14]的预测结果进行对比,如图3和表2所示。

图3 各模型预测结果对比

表2 各模型评估结果对比

从各模型的预测结果可以看出,PSO-ELM曲线没有剧烈的波动和偏差,具有良好的泛化性能,与ELM及其他方法相比,精度有很大提高,对于非线性、非平稳数据集有更好的鲁棒性。

6 结论

笔者从器材消耗序列特点和传统器材需求预测建模缺陷出发,针对时间序列的波动性、间歇性、随机性等问题,提出了基于PSO-ELM的预测模型,选取3种非线性、非平稳性的股价数据集进行效果测试,并对装备器材消耗量数据作出预测,验证了预测方法对于提升精度效果的稳健性。对器材消耗进行科学预测,把握消耗规律,可以为现实生活器材管理中采购计划的制订提供参考依据。

猜你喜欢
维数适应度器材
改进的自适应复制、交叉和突变遗传算法
一类一维齐次Moran集的维数结果
基于SVD 与数学形态学分形维数谱的战场声特征提取*
砂糖橘皮破坏效果的分形描述
AV TOP 100!2020-2021年度优秀影音器材推荐榜简评
Schur定理的推广
AV TOP100! 2019-2020年度优秀影音器材推荐榜简评
启发式搜索算法进行乐曲编辑的基本原理分析
视听器材个股表现
视听器材个股表现