基于粒子群优化和改进蚁群算法的电力供应链博弈分析

2022-10-09 11:30姚拓中
浙江电力 2022年9期
关键词:粒子神经网络经销商

姚拓中

(宁波工程学院,浙江 宁波 315201)

0 引言

电力系统的供应链由众多上下游企业聚集而成,强化企业之间数据和信息的通信与分析处理不仅对于提高供应链各环节之间的交易顺畅度起到关键作用,也将提升各个节点企业的收益,从而增强整个电力供应链的竞争力。然而,传统的信息处理技术在诸如优化节点企业的竞争策略选择、提升交易信息的透明度等方面存在诸多问题,已无法满足当下越来越高的市场需求。

在供应链企业博弈领域,近些年国内外的相关研究已取得了诸多成果。李季芳等人通过构建竞合博弈模型,致力于从供应链中找出能够相互合作最优的企业[1]。孔祥西等人构建的博弈模型可以在不同的响应环境下实现基于信息共享的博弈均衡[2]。张路等人通过博弈分析区块链技术对于金融激励机制的影响,进而解决不同企业之间的信任和收益分配问题[3]。Liu W 等人研究了如何为物流服务集成商和提供商搭建基于质量控制的博弈模型[4]。随着区块链技术的快速发展,关越[5]、万强强[6]和张志[7]等人分别提出将区块链技术应用到不同产业的供应链信息协同博弈中并取得了成功。Dai H 等人通过信息共享模型验证了信息共享的质量与供应链的协同效益成正比[8]。Taleizadeh A A 等人针对供应链体系在VMI 模型的基础上采用Stackelberg 博弈策略证明了收益函数极值的可求解性[9]。Esmaeili M 等人同样利用Stackelberg 博弈建立了基于二级供应链的关系模型,并在此基础上提出了最优的库存和定价机制[10]。

在电力系统领域,已开展关于供应链的利益分配[11]、采购策略[12]和信息协同[13]等方面的研究和应用并取得了显著成效。但在如何将人工智能技术与电力供应链相结合方面尚未开展广泛而深入的研究,相关的研究文献也较少。通过新兴的人工智能技术赋能传统的电力供应链系统,有望实现电力供应链整体效益的提升,使得链上各个节点企业通过不同的竞争策略在博弈中获取最佳收益。

在电力供应链体系中,绝大多数企业虽然已经通过传统的互联网和通信技术实现了彼此的交流协作,但在如何改善节点企业的竞争策略选择等方面依然存在诸多问题,这极大地影响了其供应链的效率。为此,本文采用区块链技术搭建了由供应商和经销商构成的二级供应链,并在此基础上提出一种基于粒子群优化和改进蚁群算法的链上节点企业最优竞争策略选择方法,协助供应链各节点企业获得更高的博弈利润。

1 供应链收益分析

本文将传统的电力供应链节点企业博弈模型作为初始模型,且在该供应链中有M1个供应商和M2个经销商。在博弈模型中,第i个供应商某类型产品的订单数目Ni与销售价相关。由于产品的需求量和价格成反比,则订货量可以定义成如式(1)所示。

式中:ai为市场需求量;τ为价格弹性系数(设定τ=3)。

定义整个供应链的信任成本为CT,那么供应商和经销商的利润函数Em和Es分别如式(2)所示:

由于区块链技术具有去中心化、可追溯、难篡改和高安全等优点,当采用了区块链技术之后,供应链通过去中心化可以保障数据的互联互通以及真实可靠,此时CT=0。由于信息的透明化对最终的收益会产生显著影响,为此本文定义收益的敏感系数k>1。此时,供应商可以及时从经销商处获取信息进而避免库存积压,而经销商则能够准确掌握市场需求,避免因囤货而造成损失。那么,此时供应商和经销商的利润函数分别为:

通过比较式(2)和式(3)不难发现,由于k>1和CT>0(通常是个较大值的参数),那么容易推理得到:即采用区块链技术通常能提升供应商和供应商在供应链中获得的利润。

2 基于粒子群优化的初始竞争博弈策略

尽管区块链能够帮助供应链中各个节点企业获得一定程度上的利润提升,但如何根据自身的需求实现业务的最优匹配,进而实现彼此利益的最大化仍是一个亟待解决的研究课题。上述问题可以看作一个典型的组合优化问题,虽然迄今为止已有诸如蚁群算法[14]和粒子群优化算法[15]等基于仿生学的人工智能方法可求取最优解,但上述方法通常存在收敛速度慢和解质量不高等问题。目前,深度学习在求解组合优化问题中得到了越来越多的应用[16-17],为此本文提出采用基于深度学习的改进蚁群算法,以实现供应商和经销商之间基于利益最大化的业务匹配。

本文假设供应商集合为M1={i|i=1,2,3,…,l},经销商集合为M2={j|j=1,2,3,…,k}。当上述两类企业合作时,Λ={(i,j)|i∈M1,j∈M2}为两者的匹配集。根据式(3)可以得到供应商的利润函数。采用经典粒子群优化算法[17]计算供应商收益函数最优解的具体流程如下:

2)根据产品价格的浮动变化设置相应的适应度函数,并求解粒子群的适应度以及种群的最优解。

3)根据式(4)对粒子的速度和位置进行更新,当到达最大迭代次数时算法结束。

式中:c1和c2为加速系数;r1和r2为随机数;a为惯性权重;pbest,i和gbest,i分别为每个粒子和粒子群的最优解。

3 基于改进蚁群算法的最优业务匹配

根据粒子群优化算法得到的供应商最优解,本文制定初始竞争博弈策略并发布在供应链系统上,而经销商则根据自身需求输入意向交易信息。在初始竞争博弈策略中,分别为卖出和购入的节点企业报价,其由粒子群优化算法求解得到;Mmax和Mmin分别为卖出的节点企业最高和最低报价;Smax和Smin分别为购入的节点企业最高和最低报价;σi和σj为权重系数。那么,基于加权的效益函数τij定义如下:

首先,随机选择一个节点企业(比如某个供应商),蚂蚁从该节点始发,并采用轮盘赌的策略选择下一步要到达的节点企业。那么,第i个和第j个节点企业之间的博弈概率定义为:

式中:τij和ηij分别为第i个和第j个节点企业之间的信息素(即效益函数)和启发函数;α和β分别为信息素和启发式因子的权重。每当蚂蚁访问一个节点企业时,将其放入当前解并加入到未来不允许访问的列表中。当所有节点企业都访问完毕后计算当前解的代价,并通过式(7)对τij进行更新:

式中:ρ为信息素挥发因子;d为蚂蚁数量;为第k个蚂蚁的信息素增量,其定义如式(8)所示。

式中:lk为第k个蚂蚁当前解的路径长度。

传统蚁群算法的性能主要取决于τij和ηij,而ηij通常仅考虑节点企业之间的价格差异这一个因素,进而影响了需求匹配的效果。为此,本文通过训练一个神经网络模型得到的特征矩阵来替代ηij启发式信息矩阵,以改进传统蚁群算法的性能并实现节点企业的高效业务匹配。

该神经网络模型的结构如图1所示。该模型可实现输入和输出参数之间的关联性建模,并通过基于反馈的注意力调节机制实现关联性估计的优化。将上一访问节点和当前访问节点报价以及与其他待访问节点的价格差分别作为输入。其中,节点的报价与节点间的价格差可分别通过特征向量S=(fs1,fs2,…,fsn)和D=(fd1,fd2,…,fdn)进行描述。最终模型输出的注意力层赋予每个输入节点获得最优解的概率,不同的概率大小体现了每个节点得到的关注度大小。模型首先随机初始化,将s0作为起始节点,并根据节点的受关注度大小选择st作为下一个访问节点并更新模型的各个变量。其中,特征向量C=(fs0,fst)包含了初始和当前节点的报价。

图1 神经网络模型结构

将S、C和D输入全连接层后可得到各个待访问经销商节点的相关度,并通过softmax函数对其进行归一化后得到下一步可选节点的关注度,上述过程可通过节点转移条件概率表示为:

式中:vt和w分别为需要训练得到的神经网络参数;Ct和Ht分别为第t次迭代时已访问和待访问的节点集合。P(Ct+1|Ct,Ht)越大,则表示神经网络模型下一步所选择节点获得最优解的概率越高。

在求解该模型参数时,神经网络模型首先选择初始节点c0∈H0,在第t次迭代时通过模型(当前模型参数为(vT,w)∈θ)选择下一个被访问的节点ct+1并生成长度为L的节点访问规划C∈{ct,t=0,1,…,L},上述过程可通过式(10)表示:

式中:P(C|H0;θ) 为访问规划的生成概率;P(ct+1|Ct,Ht;θ)为第t次迭代时选择下一个访问节点ct+1的概率。那么,模型的最优参数θ*估计如下:

式(11)描述了在获得最优路径集合估计C*条件下所得到的最优神经网络参数估计,而ct*为该条件下第t次迭代时下一个访问的节点。为了最优化求解式(11)以获得最短路径长度所对应的访问规划,本文采用经典的强化学习方法[18]实现。

采用该神经网络模型将每个节点企业逐一设置为初始起点,并分别运行一次该模型,进而得到剩余节点所对应的特征向量,并根据各个节点的匹配度大小来选择下一步需要访问的节点企业,而后将全部节点的特征向量通过拼接得到最终的启发式矩阵ηij。最后,如果节点企业之间的业务匹配成功,则根据合作节点的博弈信息利用私钥进行数字签名,进而生成智能合约执行。

4 实验分析

本文对电力供应链各个节点企业的竞争博弈进行模拟。以传统的以太坊区块链系统作为基础,处理器为Intel Core i9,内存64GB,开发环境为Ubuntu18.04,深度学习采用Pytorth 1.02。

实验分别选取5个供应商和5个经销商作为供应链节点企业参与模拟竞争策略博弈,并采用国网浙江省电力有限公司近五年某一系列产品型号的内部统计数据(如表1所示)。

表1 产品的需求量和均价

本文算法的各个参数设置如下。

1)粒子群算法的参数设置:种群初始化50个,粒子数初始化25 个,加速系数分别为c1=1 和c1=1.5,惯性权重初始化为a=0.5,最大迭代次数为100。

2)基于深度学习的蚁群优化算法的参数设置:蚂蚁数目初始化为d=60,信息素和启发式因子的权重分别为α=1.5和β=1.5,信息素挥发因子ρ=0.6,迭代次数为300 次。神经网络模型采用强化学习算法[18]进行训练,并根据随机贪婪策略选择待访问的节点企业。本文使用Xavier 对神经网络模型的参数进行初始化,并通过Adam算法对其进行优化更新,初始学习率η=0.000 1,训练迭代次数为100,批训练量为512。

3)供应商和经销商的竞价范围分别为[45,81]和[60,96],供应商对销售价格和数量的权重分别为0.3 和0.7,经销商对购买价格和数量的权重分别为0.6和0.4,收益的敏感系数k=1.15,供应链信任成本CT=1 000。

表2 给出了供应商和经销商的交易意向统计,而表3则给出了本文方法得到的节点企业最优业务匹配结果和相应的效益值。根据效益值的大小可以得到供应商和经销商的最优匹配结果为:A1-B1,A2-B5,A3-B3,A4-B1,A5-B5。并且,所有业务匹配的效应值均高于0.7,表示本文方法有助于实现各个节点企业的利润最大化。

表2 供应商和经销商的交易意向

表3 节点企业业务匹配结果和效益值

5 结语

本文针对电力传统供应链信息系统存在的诸多缺陷,提出了采用人工智能技术与电力供应链相结合的解决思路。以区块链平台为基础,首先采用粒子群优化算法制定供应商的初始竞争博弈策略,接着采用基于深度神经网络优化的蚁群算法实现供应商和经销商之间业务的最优匹配。实验数据表明,本文所提方法通过智能化手段使得供应链体系中各个节点企业的利润最大化成为可能,并为供应链的发展提供了新的方向。

猜你喜欢
粒子神经网络经销商
基于神经网络的船舶电力系统故障诊断方法
基于人工智能LSTM循环神经网络的学习成绩预测
MIV-PSO-BP神经网络用户热负荷预测
浅谈厨电企业的年终返利制度
年度十佳经销商
虚拟校园漫游中粒子特效的技术实现
一种用于抗体快速分离的嗜硫纳米粒子的制备及表征
三次样条和二次删除相辅助的WASD神经网络与日本人口预测
惯性权重动态调整的混沌粒子群算法
问:超对称是什么?