GRNN神经网络在K公司销售木浆预测中的应用

2016-07-10 07:18梁达强
电子技术与软件工程 2016年8期

梁达强

摘 要:针对进口木浆销售的复杂非线性.本文以K公司6年以来在内地销售木浆的数据和中国海关的统计数据。选出对销售量影响最大的8个因素,建立GRNN网络模型对木浆销售量进行预测。在训练样本有限的情况下将原始数据分组进行交叉验证,选取最优网络结构和光滑因子。利用GRNN网络的优势预测2015年下半年各个区域的销售量,并与实际的销售量进行比较,发现平均误差百分比不大。只有个别点出现较大误差,但是真个预测模型的精度很好,具有实际应用的意义。

【关键词】进口木浆 销售量预测 GRNN神经网络 交叉验证

当前我国造纸行业的原料木浆主要依靠进口。K公司作为原料供应商,通过提前进口木浆在仓库储存,之后已现货的形势销售给国内造纸企业。在日益激烈的市场竞争中.在客户需求呈现多样化、特殊化的情况下,公司要增强市场的竞争力,在提高产品质量和服务水平的同时,必须对于市场的变化做出及时响应,对生产、物料进行合理规划提高公式相应效率,销售预测在这一过程中起着关键的作用。因为较为准确的销量预测可以有效的降低公司仓库的库存量,这样可以降低公司的运营成本和经营风险,提升现金流动和服务质量。但是目前,K公司对于木浆的进口计划没有一套完善的销售预测体系作为支撑,而是仅仅依靠决策者的经验判断。这种方式极易造成库存积压或者脱销,因此每个月销售量预测成为改进经营管理的重要一环。

销售量预测是一种时间序列的预测。常用的短期预测方法有移动平均法、指数平滑法、趋势外推法、博克斯一詹仓斯法(The Box—Jenkins Model,ARIMA)、回归及相关分析等,这些数值预测技术都试图用建立数学模型的方法来求解实际问题。市场是时刻变化的,未来的销售量与很多因素有关,销售量的变化是非线性的,为此要找出合适的数学模型是相当困难的。近年来,国内外有很多研究工作,开始将神经网络技术应用于预测。神经网络具有超强的非线性映射能力和向数据学习的能力,因而在各项预测中得到了广泛的重视和应用.目前为止,在预测时用得最多的是BP网络模型,但这种网络在预测时,并非没有缺点:BP网络存在收敛速度慢,容易陷入局部极小等缺点。特别是在相关企业数据样本不足时,BP网络在处理小样本的效果很不理想,预测结果容易受人为因素的影响.而另一种GRNN神经网络在逼近能力、分类能力和学习速度上较BP网络有较强的优势。此外,GRNN神经网络中人为调节的参数少,只有一个阈值,网络的学习全部依赖数据样本,这样网络就可以最大限度地避免人为主观假定对预测结果的影响。因此,本研究尝试利用GRNN网络建立预测模型,并对预测性能进行分析和评价。

1 GRNN的基本原理

1.1 GRNN统计学理论基础

GRNN--广义回归神经网络是美国学者Donald F.Specht在1991年提出的,它是径向基神经网络的一个分支。具有很强的非线性映射能力和柔性网络结构以及高度的容错性和鲁棒性。网络最后收敛于样本量积聚较多的优化回归面。它比一般的BP网络有更强的逼近能力和学习速度,可以用来处理不稳定的数据,尤其是在样本数据缺乏时,它的预测效果较为更好。GRNN的理论基础来源于于非线性回归分析,原理来源于概率论的思想:当用作函数逼近时,网络输出可以当做网络输入的回归函数,当用作分类时,起可当做相应类别的后验概率。设随机变量x,y的联合概率密度函数为f(x,y),且x的观测值为X,所以y作为X的回归其条件均值为:

当δ取取值适中,预测时所有学习样本的应变量都被计算进去,与预测点距离近的样本点对应因变量被赋予了更大权值。

1.2 GRNN网络结构

GRNN网络由输入层、模式层、求和层、输出层四层组成。如图1所示。

1.2.1 输入层

输入层功能只是简单将输入向量x=[x1...xn]输入到模式层。

1.2.2 模式层

模式层神经元数目等于学习样本的数目,各个神经元和学习样本一一对应。将学习样本作为数据中心,计算输入样本与数据中心的欧氏距离。

式中δ为拓展速度变量,它决定了基函数围绕中心点的宽度,x为输入量,xi为第i个神经元对应数据中心。

1.2.3 求和层

神经元计算公式:

其中分母SD是对模式层输出进行算术求和,各个模式层神经元权值为1:

分子SNj是对模式层输出进行加权求和,yij为模式层第i个输出和求和层第j个神经元的权值。

1.2.4 输出层

输出层中神经元数目等于学习样本中输出向量维数k,第j个神经元对应输出估计:

2 预测模型建立和求解

2.1 模型建立

由于木浆进口需要一个相对较长的准备和安排的时间,我们将K公司国内的木浆销售分为华北,华中,华东,华南,东北,西南六个销售大区,分别按月统计自2010年至2015年销售数据根据对每月木浆销售量影响因素的分析。选取了我们认为对木浆销量有直接影响的8项因素:

2.1.1 当月木浆销售价格

K公司木浆当月的销售价格。

2.1.2 当月木浆销量

K公司当月的木浆销售数量。

2.1.3 当月月份

由于木浆产销量都受一定季节影响,将月份作为一个变量因素。

2.1.4 当月人民币兑美元汇率

进口木浆结算以美元价格为准,汇率直接影响企业的采购成本。

2.1.5 国内该品类木浆当月进口总量

中国海关公布的当月该类木浆进口到中国大陆的总量。

2.1.6 地区客户该品类木浆消耗总量

K公司对国内市场进行分区管理,每个大区内按照5年内有贸易往来的客户工厂的在正常全线开机状况下的木浆消耗量作为该地区的木浆预计消耗量。

2.1.7 当月进口木浆平均价格

当月海关公布的该类木浆进口报关的平均单价。

2.1.8 下月新合同销售价格

K公司计划下月订单签订合同的销售价格。

将这八个项指标因素作为网络的输入量。将下月木浆销量作为网络输出。建立GRNN网络对销售量进行预测。以2010年1月至2015年6月的数据共396组数据作为学习样本。并且我们将2015年下半年各个大区的销售数据作为测试数据共36组,用来评价预测的效果。(数据见表1)

2.2 利用MATLAB对模型实现求解

用Matlab调用GRNN的函数newgrnn(P,T,SPREAD)建立神经网络,由于学习样本数量有限,我们采取交叉验证的方式。将数据分组代入,进行学习训练网络。反复训练可得到SPREAD为0.2时预测结果较好。采用最优的光滑因子建立网络对2015年下半的36组数据进行预测。并与真实值进行比较检验是否预测的效果如下。

由表2可以看出,虽然在一些点上误差较大,但是36个测试点的整体的预测效果不错。平均误差百分比只有4.90%。这样对公司在运营和决策中已经具备了相当大的参考意义了。

3 分析与结论

GRNN网络在根据当月木浆销售数据对下月销售量预测中可以很好的发挥左右。预测结果在大多数时候具有一定的参考价值。因为首先它的训练过程不需要反复迭代,计算速度较快。而且GRNN网络不需要对神经原个数和传递函数进行认为的设定,只需要确定光滑因子,训练过程中的网络学习完全来源于训练样本,这样可以尽量避免人为的主管因素的干扰。

当然在某些情况下,GRNN的预测结果和真实的销售量还存在较大的误差,这是由于销售问题本身的一些不可控和复杂性。一些人为操作上的意外例如质量异常,内地贸易政策变化等也会造成不可控的影响。另外训练样本数据的有限也制约了GRNN网络的学习和预测能力。通过对原始数据采集的更加准确,选取更完善的影响销量的网络输入,增加学习样本的数量这些举措是进一步提高预测精度的一个方向。对于K公司的木浆销售预测来说是一个指的深入研究和探讨的改进方向。

参考文献

[1]凤德伟,张忠能,凌君逸.基于神经网络的短期销售预测[J].计算机工程,2004,30(z1):363-364.

[2]王小川,史峰,郁磊,李洋.MATLAB神经网络43个案例分析.北京:北京航空航天大学出版社,2013:67-73.

[3]Zhao C,Liu K,Li D S.Freight volume forecast based on GRNN[J].Journal of The China Railway Society, 2004,26(1):4-7.

[4]Jin-yan WEI,Feng RU.Forecasting the traffic volume by the model of GRNN and studing its realization[J]. Journal of Changsha Communications University,2006(2):10.

[5]童玉娟,李晓会.基于GRNN的货运量预测[J].福建电脑,2013,28(10):108-109.

[6]叶春明.生产计划与控制[M].北京:高等教育出版社,2005.

[7]李霞.基于BP神经网络的销售预测研究[D] 上海:上海交通大学,2012.

[8]赵亚鹏.丁以中/基于GRNN神经网络的长江干线港口集装箱吞吐量预测[J].中国航海.2006.69(4):90-91.

[9]郭丹.径向基神经网络在木材销售量预测中的应用口[J].价值工程,2011(6):100-101.

[10]张德丰.Matlab神经网络应用设计[M].北京:机械工业出版社,2009.

作者单位

上海交通大学自动化系 上海市 200050