基于多Agent的服装供应链并发协商模型研究

2018-03-16 08:43叶智勇邓凤珠佛山开放大学广东佛山528000

物流科技 2018年2期

郑飞，叶智勇，邓凤珠（佛山开放大学，广东佛山 528000）

0 引言

面对复杂的市场竞争和动态的市场需求，纺织服装企业之间被视为竞争对手关系，因而在进行生产与销售时，往往仅从本企业出发追求自身利益的最大化，未考虑上下游企业之间的协调关系，从而造成纺织服装供应链各节点在资源或利益方面的冲突，协商是解决供应链中节点冲突的有效方法。在人工智能领域的多Agent系统因其主动性、交互性、自主性等特点而广泛应用于多个领域，将多Agent技术应用于服装供应链协商中，能确保服装企业供应链系统灵活、敏捷，同时降低成本，提高产品质量。

在服装供应链各节点的协商过程中，由于信息不对称以及动态的市场环境等因素增加了协商的难度，导致协商成功率低、协商时间长、效果不理想。本文提出的基于多Agent服装供应链并发协商模型，通过建立多Agent的服装供应链协商模型框架，以单个服装经销商和多个服装制造商为研究对象，为提高服装经销商和服装制造商之间协商的效率，增大服装经销商和服装制造商协商成功的可能性提供了可靠的理论依据。

1 并发协商模型

1.1 模型框架

假设服装供应链是由服装经销商和服装制造商组成的协同网络，服装制造商提供服装，服装经销商购买服装，一个服装经销商Agent和多个服装制造商A－gent进行并发协商模型框架如图1所示。

图1 多Agent服装供应链并发协商模型框架

由图1可见，服装经销商与服装制造商都具有各自独立的协商信息。服装经销商Agent由协调器和多个子服装经销商Agent构成。根据服装制造商Agent的数量，协调器创建相同数量的协调线程，并提出相应的协商策略对各个子服装经销商Agent进行调控，实时处理协商线程信息和其他子服装经销商Agent的及时更新。协调线程由子服装经销商Agent和与之对应的服装制造商Agent构成，保留了服装经销商Agent的协商信息，接收、拒绝提议或生成反提议。

如图2所示为单个线程的协商过程。在协商的过程中，根据服装制造商Agent的个数，协调器对协商线程进行初始化，为每个协商线程设置初始参数（如议题保留值、最大协商时间以及协商策略参数等），创建初始提议，发出协商请求，并由制造商A－gent做出响应。在进行下轮提议前，对协调器发送来的提议进行评估，看是否为最佳提议，若不是，按协商策略提出反提议，若是，则按流程进行相应的处理。无论子服装经销商Agent与服装制造商A－gent协商结果如何，每个线程都会将协商结果送到协调器，保证所有协商线程连续进行。

图2 单线程协商过程

1.2 模型假设

令：

T：Agent a截止时间；

Tm、Tri：分别表示服装制造商Agent和服装经销商Agent协商截至时间；

ωai：Agent a对议题i的权重，且

A：协商响应，且A∈ ｛接受提议，拒绝提议，提出提议｝；

Ag：表示一个经销商Agent r与多个制造商Agent mi（i=1,2,…,）的集合，即Ag=｛r,m1,m2,…,mn｝，且 a∈Ag；

S：协商策略；

C：协调策略；

U：效用函数。

则议题vi可以用直线公式求得其评价函数uavi（），议题的整体效用函数为：

于是，最终效用函数可表示为：

其中：Ur、Um分别表示服装经销商Agent的效用和服装制造商Agent的效用。

所以，多Agent供应链并发协商模型可表示为：

1.3 提议策略

提议策略由提议评价策略和提议生成策略组成。为了进行下一轮协商决策，必须对协商对手的提议做出评价，因此需要相应的协议评价策略。随着协商环境的变化，根据当前协商策略生成反提议的工作由提议生成策略来完成。提议生成策略又分为让步型和学习型两种。

1.3.1 提议评价策略

对单个协商线程而言，提议评价流程如图3所示。

在时刻t，服装经销商Agent r收到某服装制造商Agent m的提议时，判断是否超过协商时间：若在有效期内，则将本提议的效用与该服装经销商Agent r准备发送的提议的效用进行比较，若前者大于后者，表明服装经销商Agent r接受服装制造商Agent m的提议，协商成功，将协商结果发送给协调器；否则，在截至时间以前，服装经销商Agent r向服装制造商Agent m提出反提议。

1.3.2 提议生成策略

图3 提议评价流程

为了对多个并发协商线程进行管理，在协调器中要嵌入提议生成算法，寻找最优提议，同时协调器进行确认并发送给未完成协商任务的协商线程，从而更新服装经销商Agent的协商策略，提高协调器工作效率。

提议生成策略分为让步型提议生成策略和学习型提议生成策略两种。

让步型提议生成策略是提议生成策略中较为基础但很有效的策略。由Farantin提出的基于时间的让步策略认为时间是决定让步幅度的因素之一；人们根据Parzen窗估计法提出了基于对手议题保留值估计的提议策略。这两种策略具有一定互补性，为了弥补彼此的不足，人们采用动态线性加权的方法提出了线性加权的提议策略。下面重点介绍一类学习型提议生成策略：粒子群优化的协调策略。

2 粒子群优化的协调策略

2.1 粒子群算法

粒子群优化（PSO）算法是1995年由美国学者Kennedy和Eberhart提出的，由于参数少、记忆性好以及收敛快等特点，受到广泛关注。该算法属于进化算法的一种，其思想源于鸟群捕食，通过对适应度的评价来获取解的质量。最优化问题的解被抽象为一些无质量与体积的微粒，通过群体行为寻找整个搜索空间的最优解。粒子群算法如下：

D维空间中，有N个粒子，适应值函数为f（·）；粒子i的位置为xi=（xi,1,xi,2,…,xi,n），将xi代入适应函数f（ xi）求适应值；粒子 i的速度为 vi= （ vi,1, vi,2,…,vi,n），粒子i经历过的最好位置为pbesti=（pi,1, pi,2,…,pi,n），种群所经历过的最好位置为gbesti= （ gi,1, gi,2,…,gi,n）。则粒子i的速度和位置更新公式分别为：

其中：j=1,2,…,n；ω为惯性权重，调节搜索范围，本文取1；c1,c2为加速度常数或学习因子，调节学习最大步长；r1,r2为［0,1］区间的随机数，以增加搜索的随机性。

通过式（4）和式（5）的迭代，比较相邻粒子的适应值，求出粒子的局部最优解，然后对所有局部最优值进行比较，其中的最小值即为当前的全局最优值。即：

2.2 供应链并发协商中的粒子群优化协调策略

为将粒子群优化算法应用于服装供应链并发协商模型中，就服装经销商Agent而言，令协商线程为粒子，线程间的相互提议为粒子的当前位置，则某个线程协商成功的提议即是粒子的个体最优解，全局最优解就是当前所有协商成功的线程中效用最大的那个提议，效用函数Ur为适应度函数，提议值的变化量是速率。根据图3，基于粒子群的服装供应链并发协商过程如下：

Step1：根据服装经销商Agent的数量，协调器创建相应的线程，对协调线程的提议策略及PSO的参数进行初始化，如服装制造商Agent的数量n，议题个数N，制造商Agent对议题的权重协商截至时间T，对第i个议题的最小值和最大值及让步率β，算出当前最佳提议并发送到其他子服装制造商Agent。

Step2：初始时刻，服装经销商Agent与服装制造商Agent分别采用基于时间的协商策略进行协商。

Step3：子服装经销商Agent收到的协商结果的效用若比己方提议效用值小则保留，否则调整让步策略。若协商成功，则转入下一步，否则继续Step3。

Step4：若协商活动的结果为成功，协调器会对从协商线程收到的协商成功结果进行评估，看是否为最佳提议，若是，将此提议发送给其他协商线程，否则保持，直到其他进程协商结束。

3 模拟实验

在服装生产与销售环节，服装生产商与经销商常会对生产——销售情况进行协商。就佛山服装生产商而言，在其生产能力限度内，往往追求订单充裕、交货时间合理、价格合理、产品新颖、型号齐全等，而经销商往往期望存货少、交货及时、款式新颖、价格适中等，代表消费能力。本文以一个服装经销商Agent和n个服装制造商Agent i（ i=1,2,…,n）为仿真实验对象，对N个议题的协商（这里对产品价格、订购数量和交货时间3个议题进行协商，即N=3）。实验参数的设置及协商议题如表1、表2所示。

根据粒子群算法，得到制造商Agent从5到35时，联合效用、协商时间和协商成功率如表3所示。

从表3可以看出，在不咯率成本的情况下，随着制造商的增多，效用值也增大，说明和越多制造商进行协商，所得效果越好，同时随着制造商数量的增多，平均协商时间缩短，协商成功率增长速率降低。

4 结论

在服装供应链环境中，以服装经销商和服装制造商为对象，建立了多Agent供应链并发协商模型，利用PSO优化算法求出最佳提议，并通过协调器将其发送给其他线程，结合基于时间的让步策略和基于Parzen窗对手议题保留值估计的提议策略，对不同数量制造商时的联合效用、平均协商时间以及协商成功率进行了分析，证明模型与实际系统基本相符。以后的研究重点将是Agent之间的信任关系以及供应链外部环境对协调结果的影响。

表1 实验参数的设置

表2 协商议题及取值范围

表3 不同数量制造商Agent时的联合效用、平均协商时间与协商成功率

[1] 蒋国瑞,等.多Agent制造业供应链管理[M].北京：科学出版社，2013.

[2] Trelea I.The particle swarm optimization algorithm:convergence analysis and parameter selection[J].Information Processing letters,2003,85(6):315-317.

[3] 路健,等.供应链环境下产能优化配置问题的混合粒子群算法[J].计算机集成制造系统，2012,18(11):2537-2545.

[4] 刘小华，林杰.基于遗传粒子群混合算法的供应链调度优化[J].控制与决策，2011,26(4):501-506.

[5] 郑飞.闭环供应链环境下纺织服装业组织运作模式[J].物流技术，2015,34（7上）:224-226,284.

[6] 汪胡林，马金平.基于多Agent的BTO供应链的动态构建方法研究[J].物流工程与管理，2013,35(6):123-127,155.

[7] 金坤，薛耀文.供应商参与产品创新的供应链协调研究[J].物流科技，2012,35(2):12-17.

[8] 马慧民,等.基于粒子群算法的供应链生产、配送集成计划研究[J].计算机工程与应用，2008,44(30):206-209.

[9] 苏生,等.供应链协商调度模型与算法[J].软件学报，2014,24(1):12-24.

[10]董晴，戴更新.竞争模式下利他偏好的供应链协调[J].物流科技，2017,39(9):114-117.

[11]邓汝春.服装业供应链管理[M].北京：中国纺织出版社，2005.

[12] Kennedy J,Eberthart R C.A discrete binary version of the particle swarm optimization[J].Proceedings of the Conference on System,Man and Cybernetics,1997,97:4104-4109.

[13]杨以雄.服装物流管理教程[M].上海：东华大学出版社，2013.

[14]胡小建，陈启萍.面向供应链基于博弈的并发协商模型研究[J].中国机械工程，2013,24(2):163-168.