基于LSSVM-DACPSO模型的物流需求预测

2015-07-30 12:33耿立艳
统计与决策 2015年14期
关键词:需求预测适应度粒子

耿立艳,郭 斌

0 引言

物流需求预测在制定物流发展整体规划、整合物流资源、进行有效物流管理中起到非常重要的作用。物流需求是社会经济活动的派生需求,主要受到经济发展整体水平、产业结构、技术进步等众多因素的影响,而且各因素之间的关系复杂,导致物流需求与其影响因素之间具有难以用精确数学模型描述的复杂非线性关系。

目前,物流需求预测模型主要包括时间序列分析模型、回归分析模型、灰色预测模型、粗糙集理论、神经网络法、支持向量机等,但这些方法在物流需求预测中尚存在一定问题,难以获得理想的预测效果。最小二乘支持向量机[1](Least Squares Support Vector Machines,LSSVM)是一种改进型SVM,以等式约束替换SVM中的不等式约束,将求解二次规划转化为求解线性方程组,降低了计算复杂性,提高了运算速度,在物流需求预测中得到应用[2,3]。LSSVM的预测精度取决于其参数的选择,目前对LSSVM参数的选取没有统一的规则,主要依赖于经验与试算,在一定程度上限制了LSSVM的推广与应用。为解决这一问题,智能算法,如遗传算法[4]、蚁群算法[5]、粒子群算法[6]等,被引入到LSSVM参数优化中,一定程度上改善了LSSVM预测效果。

粒子群优化(Particle Swarm Optimization,PSO)算法以其算法简单、有效的特点,被广泛用于选择LSSVM最优参数。但标准PSO算法存在收敛速度慢、易于陷入极值等缺陷,限制了其寻优能力的提高。近年来,许多学者对影响标准PSO算法的两个关键参数——惯性权重和加速系数进行了改进,提出了不同的改进PSO算法。在加速系数改进PSO算法中,获得广泛认可的有时变加速系数粒子群优化(Time Varying Acceleration Coefficients Particle Swarm Optimization,TVACPSO)算法[7]和动态加速系数粒子群优化(Dynamic Acceleration Coefficients Particle Swarm Optimization,DACPSO)算法[8]。文献[9]利用时TVACPSO算法选择LSSVM最优参数,并通过区域物流需求数据,验证了其有效性。目前有关DACPSO算法选择LSSVM最优参数的研究很少,因此,DACPSO算法选择LSSVM最优参数的有效性有待验证。

本文提出一种LSSVM结合DACPSO算法的物流需求预测模型,利用LSSVM的非线性映射能力预测物流需求量,同时采用DACPSO算法优化选择LSSVM的最优参数。利用我国的物流数据,根据所选用的评价指标评价模型的有效性。结果表明,与其他模型相比,本文模型在物流需求预测方面具有更好的性能。

1 算法原理

1.1 最小二乘支持向量机

设一个给定的样本集 (xk,yk),k=1,2,...,N ,xk∈Rd为d维输入向量,yk∈R为相应一维输出变量,利用内积定义的非线性映射函数ϕ(·)将样本集从原始输入空间映射到高维特征空间中,然后在这个高维特征空间中利用如下线性函数拟合样本集:

基于结构风险最小化原理,回归问题可转化为以下优化问题:

约束条件:

其中,ω和b分别为LSSVM的权向量和偏差值,γ为惩罚参数,ek为误差。为求解上述带约束优化问题,引入拉格朗日乘子αk,定义拉格朗日方程:

根据KKT优化条件,可得到以下线性方程组:

其中,IN为N阶单位矩阵,1N为由N个1组成的列向量,y=[y1,…,yN]T,α=[α1,…,αN]T为拉格朗日乘子矩阵,Ωkj=ϕ(xk)Tϕ(xj),k,j=1,2,...N.。

根据Mercer条件定义核函数:

解出α和b后,可得到LSSVM的回归模型为:

1.2 动态加速系数粒子群优化算法

标准PSO算法已成功应用于函数优化、极值优化、多目标优化等领域,但在某些问题优化方面,标准PSO算法在搜索初期粒子缺乏多样性,容易落入局部最优值,在搜索后期收敛速度减慢。而DACPSO算法通过动态调节加速系数的自适应能力,实现算法的多样性,避免陷入局部最优值。

设在D维搜索空间中,粒子的群体规模为m,每个粒子代表所优化问题的一个潜在解。设第i个粒子的速度和位置分别为Vi=(vi1,vi2,…,viD)和Si=(si1,si2,…,siD)。每个粒子根据前一次迭代中的个体最优位置Pibest=(pi1,pi2,…,piD)和粒子群的全局最优位置Pgbest=(gi1,gi2,…,giD)变换自身的搜索方向寻找最优解。每个粒子的位置对应一个适应度值,粒子的优劣由适应度值度量。每个粒子的速度和位置根据以下公式更新:

其中,wmax与wmin分别为最大、最小惯性权重,tmax为最大迭代次数。

c1与c2为加速系数,分别表示粒子的个体经验信息和其它粒子经验信息对该粒子寻优路径的影响。寻优过程中,在搜索初期,应有大的c1值和小的c2值,使粒子进行全局寻优、避免陷入局部极值;在搜索后期,应有小的c1值和大的c2值,使粒子不受其它粒子影响,增加粒子的多样性,提高收敛速度和搜索精度。为达到该目的,在迭代过程中,将两加速系数设为随粒子的适应度值不断更新:

其中,c1(t)∈[0,4],c2(t)∈[0,4]。fa(t)为当前粒子的平均适应度值,fg(t)为当前粒子群最优位置对应的适应度值。由式(12)可知,在迭代初期,fa(t)与 fg(t)差异较大,c1(t)值较大、c2(t)值较小,有利于全局寻优;在迭代后期,fa(t)与fg(t)差异较小,c1(t)值较小、c2(t)值较大,有利于提高收敛速度和搜索精度[8]。

1.3 LSSVM-DACPSO模型

LSSVM的形式决定于核函数的选择,选择不同的核函数可形成不同的LSSVM模型。常用的核函数中,径向基(Radial Basis Function,RBF)函数具有较强的泛化能力,应用最为广泛,若选取RBF函数为核函数:

其中,σ2为核参数,则LSSVM回归模型转化为:

为获得较好的性能,需调整LSSVM参数(γ,σ2),一般采用交叉验证法,但该方法比较耗时,且带有一定的主观性和随意性,难以获得最优解,在一定程度上影响LSSVM的预测精度和建模速度。

LSSVM-DACPSO模型将LSSVM的构建及预测步骤嵌入到DACPSO算法寻优过程中,利用DACPSO算法搜索LSSVM参数(γ,σ2)。基本思想是,每个粒子在γ和σ2构成的二维空间中搜索全局最优解,将LSSVM的预测误差设为适应度函数,计算每个粒子的位置对应的适应度值,通过适应度值来寻找粒子的全局最优位置。具体设计如下:

①数据标准化处理。对原始数据样本进行标准化处理,将其转化为[0,1]之间的无量纲数据,标准化公式如下:

②初始化粒子群。设定群体规模数m,最大、最小惯性权重wmax、wmin的值,以及最大迭代次数tmax。在二维搜索空间中随机产生一组参数(γ,σ2)作为粒子的初始速度和位置。

③定义适应度函数。将适应度函数定义为均方根误差:

④粒子进化。根据式(16)计算每个粒子的适应度值,在迭代过程中,搜索每个粒子的最优位置Pibest和粒子群的全局最优位置Pgbest。根据式(8)、式(9)更新粒子的速度和位置,根据式(10)计算惯性权重,根据式(11)、式(12)计算加速系数。

⑤终止条件判断。若最大迭代次数满足要求,则停止计算,此时全局最优位置Pgbest即为LSSVM最优参数值;否则t=t+1,转到步骤③。

⑥LSSVM模型建立。将最优参数(γ*,σ2*)代入式(5)求解出α和b,根据式(14)建立LSSVM模型并进行预测,再对预测值进行反标准化处理,最终得到原始数据的预测值。

2 实例分析

2.1 指标选取

物流需求包括质量和数量两个方面,质量方面指物流活动提供的物流服务水平;数量方面指物流活动中运输、储存、装卸、包装、流通加工等物流作业量的总和,即物流需求规模。相应的,物流需求的量化指标分为两类:物流需求质量指标和物流需求规模指标。物流需求质量指标主要有物流时间、物流费用、物流效率,在定量预测中很少使用该类指标。物流需求规模指标主要有社会物流总费用、社会物流总额、货运量及货物周转量。社会物流总费用是一定时期内社会物流活动中各项支出的总费用,它从物流成本角度衡量物流需求,其变化反映了物流需求的变化趋势,是比较准确的物流需求量化指标;社会物流总额是一定时期内全社会物流物品的价值总额,它从价值量角度衡量物流需求,其变化能在一定程度上反映物流需求的变化趋势;货运量及货物周转量从货运规模角度衡量物流需求,物流活动中除了货物运输环节外,还包括储存、包装、流通加工等多个紧密相关的环节,所以货物运输量不能完全代表物流作业量。综上分析,本文选取社会物流总费用作为物流需求的量化指标。

物流需求的影响因素广泛且复杂,可概括为以下几个方面:(1)国家经济发展水平。物流需求作为经济活动的派生需求,与国家经济发展水平密切相关。国家经济发展水平及速度对物流需求产生直接影响,经济发展水平越高、发展速度越快,对物流的需求就越大。(2)产业结构。各产业对物流的需求程度不同,第一产业和第二产业的产品产量是物流运输的主要对象,它的多少直接反映了物流需求的大小;第三产业以服务业为主,对物流的依赖程度较小。但随着我国产业结构的调整与升级,尤其是第三产业比重的快速增长将会带动批发零售业和运输业的发展,从而带动物流的需求的快速增长。(3)固定资产投资总额。固定资产投资总额是固定资产投资的外在表现形式,固定资产的投资将转化为下一时期的生产能力,促使物流需求相应增加。(4)货物进出口总额。国内外贸易能够促进社会商品的流通,商品的流通要依赖于物流的支持,从而对物流需求起拉动作用。随着货物进出口总额的增长,物流需求不断增长。(5)社会消费品零售总额。社会消费品零售总额的大小,直接反映一个国家的商品产销和配送的发展水平,是衡量物流需求直接表现的指标,社会消费品零售总额的增长将加快物流需求的增长。(6)居民消费水平。居民消费水平直接决定了企业的生产和销售活动,从而对物流需求产生影响。居民消费水平的提高会促使企业生产和销售新产品,推动物流的需求,反之,则会抑制物流的需求。(7)信息技术。信息技术的发展可以提升物流需求的服务质量和范围,进而增加对物流的需求。邮电业务总量在一定程度上可以反映一个国家的信息技术发展水平,可作为信息技术的衡量指标。(8)物流运输需求。运输是实现货物位置转移的重要环节,物流运输需求在物流需求中占较大比重,对物流需求产生重要影响,物流运输需求的增长将引起物流需求的增长。

综上所述,依据指标的可量化性和数据的可得性,选取以下11项指标为物流需求的影响因素:国内生产总值、固定资产投资总额、第一产业总产值、第二产业总产值、第三产业总产值、邮电业务总量、货物进出口总额、社会消费品零售总额、居民消费水平、货运量,以及货物周转量。以我国1991~2011年相关数据为样本进行实例分析。

2.2 模型训练与预测

首先将数据样本标准化到[0,1]区间,然后将整个数据样本分为两部分:1991~2005年的数据作为训练样本训练模型,2006~2011年的数据作为检验样本验证模型的预测能力。

LSSVM-DACPSO中,DACPSO算法的自身参数作如下设置:粒子群规模m设为10;最大迭代次数tmax设为30;最大、最小惯性权重分别设为wmax=0.9,wmin=0.1,加速系数c1(t)和c2(t)依赖于粒子群的适应度值,这里无须设置。DACPSO算法寻优过程中,为减少随机性对LSSVM参数选择的影响,选取连续运行10次中获得的最优参数(γ*,σ2*)建立LSSVM模型,然后进行向前一步预测。

2.3 结果分析

为验证本文模型的预测性能,同时利用TVACPSO算法、标准PSO算法、交叉验证法(Cross Validation,CV)选择LSSVM最优参数并建立预测模型预测物流需求,分别记为LSSVM-TVACPSO模型、LSSVM-PSO模型、LSSVM-CV模型,其中,TVACPSO算法的自身参数设为:m=10;wmax=0.9,wmin=0.1;c1,ini=2.5,c1,fin=0.5,c2,ini=0.5,c2,fin=2.5;tmax=30。PSO算法自身参数设为:m=10;wmax=0.9,wmin=0.1;c1=c2=2。CV方法采用5折交叉验证法确定LSSVM参数。四种算法搜索的最优参数及所用时间如表1所示。

表1 最优参数及搜索时间

DACPSO算法、TVACPSO算法和PSO算法搜索LSSVM最优参数的时间均明显少于5折交叉验证法,其中,DACPSO算法有效的局部与全局搜索能力使得寻优所用时间最少,仅为20.5765秒,而基于5折交叉验证法的寻优过程计算工作量很大,所用时间达到138.7785秒。

图1 预测结果比较

表2和图1分别给出四种模型的预测结果和相对预测误差。LSSVM-DACPSO模型的预测精度明显优于其他三模型,预测出的社会物流总费用较其他三模型更接近于实际值。LSSVM-DACPSO模型预测期内的最大、最小相对预测误差仅为2.92%和0.66%,其他三模型的最大、最小相对预测误差较大,分别为3.68%和1.33%、3.69%和0.97%、3.64%和0.87%。

表2 相对预测误差比较

采用均方根误差(Root Mean Squared Error,RMSE)、平均绝对误差(Mean Absolute Error,MAE)、平均相对误差(Mean Percentage Error,MPE)、西尔统计量(Theil)共 4项指标评价模型的预测能力,指标定义如下:

其中,n为检验样本个数,yl和分别为社会物流总费用的实际值与预测值。以上指标值越小,模型的预测能力越好,结果如表3所示。

表3 预测能力比较

由表3可知,LSSVM-DACPSO模型的预测能力优于其他三模型,其RMSE、MAE、MPE、Theil值均明显小于其他三模型的对应值,这主要是由于DACPSO算法通过使加速系数随适应度值不断变化,保障粒子的多样性和算法的收敛性,进而提高了LSSVM的预测能力。TVACPSO算法通过使加速系数随迭代次数不断变化,增加粒子的多样性及收敛性,搜索性能较标准PSO算法有所改善,因而LSSVM-TVACPSO模型的预测能力介于LSSVM-DACPSO模型与LSSVM-PSO模型之间;而LSSVM-CV模型由于5折交叉验证法的主观性与随意性,预测能力在四模型中最差。

3 结论

本文提出一种基于DACPSO算法的LSSVM物流需求预测模型,并以我国物流需求为研究对象,通过最优参数搜索时间、相对预测误差和预测性能评价指标RMSE、MAE、MPE、Theil验证模型的有效性。结果显示,LSSVM-DACPSO模型的相对预测误差值和四个预测性能评价指标值均小于LSSVM-TVACPSO、LSSVM-PSO及LSSVM-CV模型的对应值,且DACPSO算法搜索LSSVM最优参数的时间小于TVACPSO算法、PSO算法及CV方法。因此,从提高预测能力与建模速度角度,LSSVM-DACPSO模型是一种有效的物流需求预测方法,为物流需求预测提供有益参考。

[1] Suykens J T,Van G I.Least Squares Support Vector Machines[M].Singapore:Singapore Word Scientific,2002.

[2] 庞明宝,谢玲,郝然等.基于偏最小二乘支持向量机回归区域物流量预测[J].河北工业大学学报,2008,37(2).

[3] 梁毅刚,耿立艳.基于核主成分-最小二乘支持向量机的区域物流需求预测.铁道运输与经济,2012,34(11).

[4] 许桂梅,黄圣国.应用LS-SVM的飞机重着陆诊断[J].系统工程理论与实践,2010,30(4).

[5] 王娟,刘明治.蚁群算法滚动优化的LS-SVM预测控制研究[J].控制与决策,2009,24(7).

[6] 陈如清,俞金寿.基于粒子群最小二乘支持向量机的软测量建模[J].系统仿真学报,2007,19(22).

[7] Chaturvedi K T,Pandit M,Srivastava L.Particle Swarm Optimization With Time Varying Acceleration Coefficients For Non-Convex Eco⁃nomic Power Dispatch[J].Electrical Power and Energy Systems,2009,(31).

[8] 纪震,廖惠连等.粒子群算法及应用[M].北京:科学出版社,2009.

[9] Geng L Yan,Dong Q T.Forecast of Regional Logistics Demand Us⁃ing KPCA-Based LSSVMs Optimized By PSOTVAC[J].Advanced in Information Sciences and Services Sciences,2012,4(19).

猜你喜欢
需求预测适应度粒子
改进的自适应复制、交叉和突变遗传算法
碘-125粒子调控微小RNA-193b-5p抑制胃癌的增殖和侵袭
基于膜计算粒子群优化的FastSLAM算法改进
基于BP神经网络的济南市物流需求预测
Conduit necrosis following esophagectomy:An up-to-date literature review
一种基于改进适应度的多机器人协作策略
基于粒子群优化极点配置的空燃比输出反馈控制
基于计算实验的公共交通需求预测方法
基于空调导风板成型工艺的Kriging模型适应度研究
基于灰色马尔可夫模型的公务航空市场需求预测