周建萍,张 健,茅大钧
(上海电力大学自动化工程学院,上海 200090)
近年来,随着计算机和通信技术的发展,多智能体系统的协调控制也因其在解决众多理论和工程问题中的应用而受到广泛关注[1],如无人机编队控制[2],多机器人编队[3],卫星星团姿态同步[4]等方面应用。一致性问题是多智能体系统协调控制的基本问题,即要求所有智能体通过通信网络获得邻居信息实现对其状态协议更新,使所有智能体状态在所设计的通信和交互规则下达到一致。目前针对多智能体系统一致性问题已取得不少成果,按照多智能体系统的动力学模型可分为:一阶[5-7]、二阶[8,9]、三阶[10,11]、高阶[12,13]。
在实际应用中,由于CPU 处理速度和内存容量的限制,智能体不能频繁地进行控制以及与其邻居智能体交换信息。因此,针对资源有限嵌入式系统的新型控制方式---事件触发控制应运而生[14]。所谓事件触发控制是指控制任务按需执行,智能体与邻居之间只有当一个特定事件发生(如状态误差超过规定的阈值)时才进行信息传递,避免了智能体之间大量的冗余信息传输。基于此,事件触发机制能有效应用到多智能体系统的一致性问题研究中。关于采用事件触发控制多智能体系统一致性始于文献[15],并在各种类型多智能体系统中都取得巨大进展。D.V.Dimarogonas等人[15~18]基于事件触发控制机制来研究了一阶多智能体系统的一致性问题。其中文献[16]给出了一种集中式事件触发控制策略,系统中的所有智能体共享一个触发函数,当一个事件发生时,所有智能体同时更新采样状态和控制输入。文献[17]、[18]提出了一种分布式事件触发控制策略,系统中每个智能体的触发时刻由对应的触发函数决定,相比于集中式事件触发控制策略,分布式事件触发控制策略能够更有效地减少智能体之间的信息通讯量。文献[19~23]基于事件触发机制探讨了二阶多智能体系统的一致性问题。其中文献[19]提出的控制协议为分布式事件触发控制策略,文献[20]则为集中式控制触发控制策略,文献[21]将分布式事件触发控制策略与集中式控制触发控制策略进行了对比研究。文献[22]研究了二阶多智能体系统在固定无向拓扑下的平均一致性问题,构造了依赖于时间变化的触发函数,并对系统存在时滞的情形进行了讨论;文献[23]针对二阶含有领航者的多智能体系统一致性问题进行了分析和研究。需要注意的是,现有的基于事件触发控制多智能体系统一致性研究成果大多数集中在一阶和二阶系统。迄今为止,针对采用事件触发控制三阶多智能体系统的研究非常少,目前在文献[24]中基于事件触发控制机制研究了三阶多智能体系统的一致性,但是该研究是在离散时间下进行的。在实际工程中,需要系统工作在连续时间情况下。考虑到实际模型中三阶和高阶系统十分普遍,且其性能指标又十分复杂,因此对三阶连续多智能体系统的一致性研究更具有实际意义。
基于上述原因,本文将事件触发控制机制应用于三阶连续多智能体系统的一致性研究中,利用位置、速度和加速度三者的测量误差设计了分布式事件触发控制协议去实现在有向固定通信拓扑的三阶连续多智能体系统的一致性。在该方法下,系统中的每个智能体仅在事件触发时刻更新控制输入,从而降低系统的控制更新频率。采用模型转化方法将系统的一致性问题转化为稳定性问题,并利用线性矩阵不等式方法和Lyapunov稳定性理论给出系统达到一致性的充分条件。实验结果表明采用事件触发控制策略可使三阶连续多智能体系统达到一致性的同时节省了通信资源,为三阶多智能体系统控制提供了一种新的研究思路。
引理1[22]如果G含有一颗有向生成树,那么拉普拉斯矩阵L满足如下性质:
1)rank(L)=N-1;
2)至少一个零特征,1N作为其对应的特征向量,满足L1N=0;
3)L的N个特征值均含有非负实部,且它们可按升序排列为0=λ1(L)≤…≤λN(L)=λmax(L)。
对于三阶多智能体系统,智能体i的动态方程描述为
(1)
式中,xi(t)∈R,vi(t)∈R、zi(t)∈R和ui(t)∈R分别表示智能体i的位置、速度、加速度状态信息和控制输入。
一致性控制协议[20]被给出
(2)
其中,反馈增益常数k>0随后将会被确定。
对于智能体i的位置、速度、加速度测量误差被定义为
(3)
(4)
(5)
智能体i控制协议进一步满足
(6)
(7)
定义1:对于三阶多智能体系统(1),当且仅当所有智能体的位置变量、速度变量、加速度变量满足以下条件时,则称系统(1)能达到一致性。
如上所述,每个智能体根据自身和来自邻居的位置、速度和加速度信息来确定事件时刻执行其控制输入更新。满足式(6)得出智能体i分布式控制协议
(8)
由(3)~(5)可得
(9)
由(1)和(9)可得
(11)
和
(12)
其中
引理2[20]对于有向图G的拉普拉斯矩阵L,存在非奇异矩阵
(13)
使得L相似于对角矩阵Λ得到:
(14)
(15)
对智能体定义:
ex(t)=col(ex,1(t),ex,2(t),…)
ev(t)=col(ev,1(t),ev,2(t),…)
ez(t)=col(ez,1(t),ez,2(t),…)
(16)
基于引理1,使用坐标变换
(17)
然后(11)可以被写成如下形式
(18)
其中
实质上,系统(18)可以被认为是两个互相连接子系统
(19)
和
(20)
(21)
其中
定理1 假设图G含有一颗有向生成树,且事件触发函数为
fi(ζi,ξi)
(22)
或
(23)
存在常数k≻1使得系统(1)在协议(8)下,所有智能体均满足定义1,即系统(1)可达到一致性。
其中,ξi(t)=col(xi(t),vi(t),zi(t)),ζi(t)=col(ex,i(t),ev,i(t),ez,i(t)),i∈N,ξ(t)=col(x(t),v(t),z(t)),ζ(t)=col(ex(t),ev(t),ez(t))。
证明:考虑(17)~(18)或者(20),选择Lyapunov 函数如下
V(ε)=εTPε
(24)
其中
(25)
=-εTQε+2εTPJ2e
(26)
其中
引理3[25]:(Schur补)线性矩阵不等式(LMI)
其中,S为分块对称矩阵,S11、S22均为方阵,等价于下面任意一个条件
(27)
(28)
由引理3结合式(26)得
≤-λ(Q)‖ε‖2+2λmax(P)‖J2‖‖ε‖‖e‖
≤-‖ε‖[λmin(Q)‖ε‖-2λmax(P)‖J2‖‖e‖]
≤-‖ε‖[λmin(Q)(I2⊗WU-1)‖ξ‖-2λmax(P)‖J2‖(I2⊗WU-1)‖ζ‖]
≤-‖ε‖(I2⊗WU-1)[λmin(Q)‖ξ‖-2λmax(P)‖J2‖‖ζ‖]
(29)
当满足
或
其中,权重参数σi∈(0,1)。结合(29)可得
(30)
(31)
对式(31)进行积分得
(32)
由于系统(20)是指数稳定的,因此基于事件触发条件(22),解(32)具有相对于时间的指数衰减项。因此,当t→∞时,解收敛到0。因此可得
由式(17)可得
由上式知当t→∞时,有xi(t)-xj(t)→0,vi(t)-vj(t)→0,zi(t)-zj(t),即满足定义1。
证毕。
注释1:一般而言,Zeno行为是在有限时间间隔内发生无限次事件触发的现象。当然,一旦Zeno行为发生,计算机模拟变得不精确和耗时。因此,必须在模型分析中排除Zeno行为。
为了表明在整个事件触发控制过程中不会产生Zeno现象。给出了如下定理。
定理 2:考虑多智能体系统式(1)在一致性协议式(7)的作用下。假设图 G 含有一颗有向生成树。且事件触发函数满足式(22)或(23),则对于所有的智能体,任意两个连续事件触发时刻之间的间隔tD不小于
(33)
(34)
其中,y满足y(t)≤φ(t,φ0),这里的φ(t,φ0)是方程的解,满足
(35)
在初始条件φ(0,0)=0下解方程(35)得
(36)
(37)
结合(33)则有
(38)
(39)
由(36)和(39)可解出时间下界
证毕。
本部分将利用一个仿真来验证本文所提算法及理论的正确性和有效性。假设三阶多智能体系统包含四个智能体,且有向通信拓扑结构如图1所示,可以明显看出该图包含有向生成树。
图1 通信拓扑
通信拓扑Laplacian矩阵由下式给出
对于起始位置、速度、加速度和各参数分别设置为:x(0)=col(10,20,30,40),v(0)=(1,2,3,4),z=(0.5,1,1.5,2),k=1.5,采样周期T=0.01。
仿真结果如图2~图7所示。
图2 位置轨迹
图3 速度轨迹
图4 加速度轨迹
图5 测量误差与阈值
图6 事件触发序列
图7 事件触发序列(19s~20s)
图2、图3和图4分别表征了多智能体系统(1)的位置、速度和加速度的轨迹,从图中可以看出,随着时间的推移,三个变量均达到了一致性,表明了本文所提出的事件触发控制策略可使三阶多智能体系统到达一致性。根据定理1可知,基于控制器(2)和事件触发函数(31)的系统(1)能实现一致。从图2~图4可以看出,仿真结果与理论分析符合。即验证了定理1的有效性。
图5给出了0s~20s各智能体的事件触发阈值和定义测量误差。图6给出了0s~20s各智能体的事件触发时刻序列。从图5、图6中可以看出,本文所设计的事件触发协议确实可以有效减少智能体之间的通信次数,从而达到节约资源的目的。图7是对图6触发较为密集的19s~20s 的时间区间进行了局部放大,可以看到各次触发之间的时间间隔仍然是严格大于零的,没有发生 Zeno 行为,符合理论结论。
本文研究了三阶连续多智能体系统一致性问题,构造了一个分布式事件触发一致性协议。基于图论和矩阵理论使所有智能体的位置、速度和加速度状态信息达到一致性。分析了所提出的事件触发一致性控制闭环多智能体系统的输入到状态稳定性,并排除了Zeno行为。最后,数值仿真验证了上述结论的有效性。