基于Bayes-BP算法的跨境电商平台采购量预测

2021-12-14 01:35孙桐徐斌贾航

计算机应用与软件 2021年12期

孙桐徐斌贾航

(大连海事大学航运经济与管理学院辽宁省物流航运管理系统工程重点实验室辽宁大连 116026)

0 引言

本文研究“互联网+外贸”环境下跨境电商平台的采购量预测，受需求、关税、物流、和采购周期等多种因素影响。但“互联网+外贸”跨境电商电商平台的核心是具有大量的数据，且是对于预测有优势的数据。只要选取了合适的影响因素以及数据，就可以得到采购预测量。因此，设计一种高效、准确的基于跨境电商平台的采购预测量模型是亟须解决的问题。在有限的时间内把货物配送成功显得至关重要，特别是跨境电商预购，货物能否按期入库都会影响到商家的经营情况。

现今，很多采购量的预测是基于历史采购量来进行预测未来采购量，考虑的是采购量自身数据的影响，对于不同因素之间的相互影响考虑较少。

杨天剑等[1]利用基于BOM单数据预测电信运营商的采购。李俊等[2](2012)将 GM(1,1)模型、非线性预测模型和二次回归预测模型相结合组成了组合预测模型，依据某企业前10个月的销量，预测后两个月的销量。

杨亦[3]根据历史采购数据，运用时间序列的方法，对采购零件构建模型，完成了零件的采购预测。尽管有预测研究考虑到相关因素对预测量影响，但没有进行相关因素的筛选，导致一些无关变量对预测的影响。赵占波等[4]根据浏览与相关因素，得到这些因素对销量的影响。由于没有进行筛选，导致相关变量如服务态度对结果的正负相关性造成干扰，降低预测准确性。任远等[5]、江沸菠等[6]、Zhao等[7]运用贝叶斯神经网络，表明了此方法较于传统的BP算法，可以提供网络泛化能力。王珏等[8]、Ma等[9]使用因果检验进行参数选取。

为此，本文提出一种基于Granger因果检验和Bayes-BP算法的跨境电商平台采购量预测方法。首先对Granger因果检验与Bayes-BP算法基本原理进行介绍，其次给出了采购预测量的算法实现方法，最后对2017年1月至2019年9月跨境电商平台关于食品、服装和化妆品的销量以及相关影响因素进行建模，并验证方法的有效性。

1 基于Granger因果检验与Bayes-BP算法采购预测量模型

1.1 Granger因果检验

Granger于1980年提出了关于因果关系的定义。在后期不断的完善中，Granger建立了一种方法，分析因素之间的联系，并且以“最小二乘法”得出期望值与预测值之间的误差。

变量X和Y之间的因果关系为：在包含了X和Y过去的信息情况下，对变量Y的预测结果优于只单独考虑由单一Y的信息来预测Y的信息，即X对于预测Y的结果有帮助，便于解释Y的未来发展趋势，则称X是Y的Granger原因。进行Granger因果检验，要构建不含滞后项X的受约束模型和有滞后项X的约束模型。计算式表示为：

(1)

(2)

式中:Xt表示待检验的Granger原因；Yt表示需要验证的Granger值；αi与βi分别表示Yt以及Xt滞后项因子，α0为常数项，εt为残差。

根据上面的公式构建，F统计量检验的联合假设H0：

β1=β2=…=βi=0i=1,2,…,q

(3)

如果在选定的显著性水平计算的Fα值小于F值，便拒绝假设，则Xt是Yt的Granger原因。本文对商品的数据做平稳性检验，即做ADF检验。确保数据满足平稳性之后，再进行Granger因果关系检验。

1.2 Bayes-BP算法

BP神经网络具有复杂的分类能力以及强大的非线性建模映射能力，被广泛应用于复杂的预测问题。

BP神经网络可以不断地修复期望与样本数据之间的误差，这源于它的计算与调整自身权值阈值来进行修正的结果[10]。但是，该模型也有一定的问题，BP算法收敛速度慢[11]，BP算法易陷入局部极小化[12]。

本文提出一种贝叶斯优化BP算法的采购量预测模型。利用贝叶斯求取预测值的平均值与方差，进而确定最优权值与阈值；对局部阈值与权值进行调整，解决原始模型存在的问题。

1.2.1算法原理

贝叶斯计算式中，随机变量由许多未知变量构成，要进行研究，要使用概率分布来对变量统计。没有获得样本数据时，模型H对于变量θ的位置概率分布成为先验分布，计算式为：

(4)

式中：p(H|θ)是H的后验概率，p(θ)和p(H)是事件的先验概率。

贝叶斯方法是在给定样本数据后，结合先验概率建立后验分布，得到了给定数据D后，根据式(4)可得到后验概率分布。

(5)

式中：p(D|θ,H)为参数似然函数，p(θ|H)为先验分布，p(D|H)为常数。后验分布比之先验分布，结合了数据，作出了相应的调整。在做预测时，后验信息作为先验信息出现，使得预测会不断调整，结果准确度更高。

为了使预测值可量化，引入方差，表示离Xi最近的n个临近点，计算式表示为：

(6)

将训练数据应用贝叶斯公式计算，可得权值的后验概率分布，计算式表示为：

(7)

式中：α、σ2是最佳超参数，由它们来调节学习率，并可决定权值w的分布；p(Y|α,σ2)是归一化参数。

从结果可以得出，分布符合多变量高斯分布，计算式表示为：

P(W|Y,α,σ2)=N(Δ,cov)

(8)

式中：Δ为平台某个商品均值;cov为平台某个商品协方差。

(9)

(10)

式中：φ为迭代参数。经过反复运算，得到更新后超参数，然后代入式(7)，可得权值最优解。

将权值代入式(11)，可求得阈值最优解。

b*=y*-w*Xi

(11)

式中：w*为权值最优解;y*为输出预测值。

BP神经网络可以正向、反方向传播信息，样本数据得出的结果和预期差距较大时，会进行反向传播。差值会被分配到神经层节点，进而对信息进行调整，最终得到合理的值。

将商品数据作为样本数据，输入变量则为X=(X1,X2,…,Xn),输出为Y=(Y1,Y2,…,Yn)，输入的数据在经过迭代后得到输出值，即采购量预测值：

(12)

式中：anj为第n个样本j层的输出;wji为i、j两层的连接权值;ani为此样本的第i层结果；bj为j层阈值。

对权值和阈值可进行调整，若结果不符期望精度要求，可进行调整，计算式表示为：

wji(t+1)=wji(t)+ηζjani+a[wji(t)-wji(t-1)]

(13)

bj(t+1)=bj(t)+ηζj+a[bj(t)-bj(t-1)]

(14)

式中：η为学习率，a为调整常数；ζj为误差反向传播值；这些参数对上层的阈值、权值进行优化，可使得收敛速度变快。

BP神经网络算法的学习率影响模型训练的速度及准确度，速率小，收敛性可以满足，但收敛慢；反之，结果可能会振荡。本文提出了一种优化学习率的方法。公式如下：

η=αe-σ2t

(15)

式中：α和σ2分别是超参数，t为迭代次数。

相比于传统BP算法，此方法减少了模型训练次数，此方法另外一种表达计算式为：

η(t)=e-λη(t-1)

(16)

式中：t代表迭代次数，e-λ为比例系数，且系数不变。

学习率变化以误差增减来判断，在迭代过程中，误差变小，说明修正方向正确；当误差超过一定范围时，说明修正方向错误，此时可以停止训练。计算式表示为：

(17)

式中：η(t-1)inc表示继续修正，η(t-1)dec表示撤销上一次修正。

1.2.2算法流程

Bayes-BP算法流程如下：

(1) 商品样本数据预处理。

(2) BP神经网络初始化模型，包含一系列相关参数，选择合适的函数。

(3) 利用Bayes定理求得高斯分布，反复迭代后，得到最佳参数，得到最优权值、阈值。

(4) 进行网络仿真训练，对于输出的数据进行验证，误差较大的进行校正，得到最终商品采购预测值。

1.3 采购预测量算法实现步骤

经过上述分析，商品采购预测量实现步骤包括：

(1) 商品采购量影响因素的选择。经过研究调查发现，影响电商平台商品采购量的因素可能有：商品单价、商品收藏量、商品评论量、好评分等级(3.5～4.0分为1级，4.0～4.5为2级，4.5～5.0为3级)、商家是否满足一周内无理由退货、是否有税费补贴、是否有优惠券、库存是否充足、商品类型(本文选取3个类型商品，食品、化妆品和服装)、商品采购速率、季节因素、广告引导浏览次数、商品加入购物车次数等13个影响因素。

其中商品采购速率的定义为：若是库存充足，则无需预购，为了便于统计，设为速率为0；库存不足，需预购时，根据实际采购，不同种类商品的速率也不同，食品类预购时间5～10天，速率设为1；化妆品类预购时间为10～20天，速率设为2；服装类预购时间为20～40天，速率设为3。商品采购周期均为一个月采购一次。

设n=13，则影响集为：

X={x1,x2,…,x13}

(2) 去除无关的因素。采用Granger因果检验分析法，对影响因素与商品销售量做检验，去除无关因素，形成新的影响因素集：

Xnew={x1,x2,…,xi}i

(3) 数据预处理。去除无关影响因素后，对数据进行相应操作。

① 对异常值数据处理：在实际生活中，商品销量受到大型活动促销因素的影响，销量值会突然增多，形成异常值，如双十一、双十二活动，去掉这些异常值。每个商品去除3年中11月、12月的记录。

② 对空缺值处理：对于一些有数值的商品相关因素，采用插补法进行数据的填充。由于随机插补法有一定的不足，会影响数据精度，本文采用组合插补法进行数据补充。

首先根据空缺值得出n(n>1)a个合理插值，得到n组数据。其次，用分析法对n组数据进行分析，会得到n个估计值。若是n个数据集估计值为X,则参数估计值为：

(18)

则插补值的计算式为：

(19)

插值能比较准确地还原真实的信息，降低误差。

(4) 设置恰当的相关参数。训练相关模型，分析该模型并与传统BP算法作对比。

2 电商平台商品采购量预测

2.1 数据来源

选取大连某自营跨境电商平台食品类、化妆品类和服装类2017年1月至2019年9月的脱敏数据集。本文了收藏量、评论量、单价等13个相关因素，数据如表1所示。由于篇幅限制，表1展示了部分相关因素的数据。

表1 电商平台销量/预购量及相关影响因素数据

其中若某商品库存充足，则不需预购，预购时间为0，此时为商品销售量；若某阶段商品库存不足，则商品预购时间由其商品类型决定，所以某商品本月的采购量为销量与预购量之和。例如商品编号为659846，销量为3 000，预购量为550，则其采购量为3 550。而编号98756商品库存是否充足为1，没有预购量，则其采购量与销量相同，也为2 870。

2.2 Granger因果检验

数据为2017年1月至2019年9月的数据，共包含3个大类：食品、化妆品和服装类，每大类选取了50个样本，一共是14 850个样本数据。去除每条数据在双十一、双十二的数据后，即删除11月与12月的数据，现有样本数据13 050个。

本文使用EVIEWS 6.0软件，对13个影响因素做了因果检验，同时也对销量做了检验，验证各序列数据的平稳性。所得结果如表2所示，可以看出，在5%显著性水平下，这些因素及商品销售量均通过了检验。建立VAR模型，结果如表3所示。

表2 13个影响因素与销量ADF检验

表3 Granger因果检验结果

续表3

在5%的显著性水平下，季节因素、广告引导浏览次数、商品加入购物车次数不是销量的Granger原因，剩下的10个因素是销量的Granger原因。在使用Bayes-BP算法进行预测时，输入值采用有效影响因素，去除掉不相关的因素。

2.3 数据预处理

研究发现，BP神经网络上一月的输入变量与下一月的输入变量有非常紧密的关系，计算结果显示如下规律：用上月的消费行为相关因素作为输入，下一月的销量作为输出，训练集与测试集得到的模型预测值拟合度较高，预测比较准确。故去除了每件商品11月、12月份的数据，并且将每条数据的输出结果统一上移了一条。即用上月的输入数据，来匹配下月的输出结果。这样也解决了未知月份，输入变量不能获取的问题。由于库存会存在不足的问题，所以某些商品在某些月份存在预购量。在进行数据处理时，将销量与预购量进行汇总，其和算作本月输出结果。

本文使用2017年1月至2019年4月的数据作为训练集，2019年5月至8月数据作为测试集，则经过模型计算，得到9月的输出结果即为2019年10月的销售量，也就是9月需要采购的数量。由于每月会进行一次采购，故9月采购的货品最迟会在10月左右到达，这样也可以有效地降低库存积压问题。选取预测商品的种类为食品、化妆品和服装。

2.4 模型精度检验

本文选取2017年1月至2019年4月的数据作为训练集，2019年5月至2019年8月的数据作为测试集。用训练集来进行训练模型，并对5月至8月的数据进行预测。本文仅显示2019年8月的预测对比数据。

其中商品编号1-5的商品类型为1，即5种食品类商品；编号6-10为5种化妆品类商品；编号11-15为5种服装类商品。

为了更好地评价Bayes-BP模型精度，本文采用LM-BP算法、ARMA模型进行预测的对比。三种模型的预测如图1所示。可以得出，3种模型预测曲线趋势较为一致，虚线会有明显偏差，带*线的误差较小，带圆圈线的精度最高。

图1 3种模型预测误差比较

为了分析3种模型的拟合精度及预测准确度，采用两个指标：平均百分比误差(Mean absolute percent error,MAPE)和均方根误差(Root mean square error, RMSE)。

(20)

(21)

式中：y代表期望值，yi为预测值。

由表4可以看到，采用了Granger因果检验后，Bayes-BP与LM-BP算法的精确度都有提高而两种算法的均方差都小于传统模型ARMA。但Bayes-BP算法明显优于其他两种算法，故采用Bayes-BP进行采购预测。

表4 算法MAPE和RMSE参数比较

2.5 预测结果

采用Bayes-BP优化算法来预测该电商平台2019年10月份，15种商品的采购量结果如表5所示。由于预测模型平均误差率在5.9%，属于有效预测，平台可以按照表5预测的结果进行实际采购。

表5 各类商品采购量

3 结语

本文对某电商平台的商品采购量进行了预测。在研究中，分析了商品的销量的时间序列特点，并结合了商品的消费行为，提出了基于Byes-BP的神经网络在跨境电商平台的预测应用，同时对消费行为因素进行了Granger因果检验。通过分析，去除了无关因素，并且做了相应的数据处理。之后，用3种模型进行预测的分析对比，得出该方法可以较好地解决预测平台采购量的问题。经过实证，该方法平均误差百分比为5.9%，可以将该方法推广至企业的实际应用中。