车辆编队的队形控制方法及应用综述*

2020-12-23 08:06田大新黄米琪李嘉炜段续庭
移动通信 2020年11期
关键词:领航者拉普拉斯队形

田大新,黄米琪,李嘉炜,段续庭

(北京航空航天大学,北京 100191)

0 引言

车联网技术的蓬勃发展为无人车辆编队的发展奠定了坚实的基础,并且车辆编队相关技术的研究也在一些领域逐渐开始发展,如民用物流产业的无人卡车编队或是军用的无人战车编队等[1]。车辆编队的队形控制问题是研究实现车辆编队的重要研究内容,而无人车作为智能体的一种,研究车辆编队队形控制问题也就类似于研究多智能体的队形控制策略问题。队形控制问题即是对多智能体群体的几何形态进行控制,当其在向预定的目标或方向前进时,能够使群体保持设定的队形,并且避免撞到障碍物和环境限界[2]。本文将主要介绍近些年车辆编队队形控制的主要研究问题,从多智能体角度出发总结一些适用于车辆编队分布式队形控制的方法并简要分析每种方法的特点,举例介绍两种队形控制应用场景,最后总结未来队形控制问题的一些研究方向。

1 队形控制主要研究内容

多智能体技术经历了十几年的发展,在队形控制方面的研究也日渐成熟,队形的形成、保持和变换过程是队形控制方面的主要研究点[3-4]。

1.1 队形形成

智能车辆在还未开始编队时在随机的位置,如何使车辆快速稳定的组织形成编队是首先要考虑的问题。队形形成过程的主要目标是让多智能体自主形成目标队形。

队形成形过程示意图如图1 所示:

图1 队形成形过程示意图

1.2 队形保持

队形保持指的是形成目标队形后,车辆根据需求按指定队形稳定快速到达目标位置。队形保持要研究的问题是在多智能体形成预定的几何形态后,群体如何保持不变的队形来进行后续的运动和作业的完成。

队形保持过程示意图如图2 所示:

图2 队形保持过程示意图

1.3 队形变换

在实现一些作业需求时编队的队形需要切换,有时需要变换队形来避免障碍物。队形变换的两种形式分别为主动变换和被动变换:主动变换一般发生在编队群体为了完成目标任务要求时,变换后的队形更有利于作业的进行或者可以提高作业的完成度。而被动变换是指编队群体被迫采取队形变换策略来保证作业的顺利进行,这往往是由于环境改变导致的,例如多智能体遇到了障碍物需要躲避。

队形切换过程示意图如图3 所示:

图3 队形切换过程示意图

2 车辆编队队形控制方法

车辆编队控制策略可分为三种:集中式、主从式和分布式控制策略。结合智能车辆的特点,主要采用的是分布式控制策略[5]。本文将选取以分布式控制策略为背景的几种较为经典且应用比较广泛的控制方法进行主要的介绍。

2.1 行动选择法

很早人们就注意到自然界的诸多群体行为,并对其展开了研究并将其应用[6]。最初行动选择法是通过研究动物的行动,如鸟类、鱼类的聚集行动,并将其应用于计算机仿真,后逐渐被推广应用到其他领域[7]。采用行动选择法对编队群体进行控制即是通过设定智能体的局部控制策略以及智能体的行动方式,来达到对群体整体运行的控制[8]。受控的基本动作根据预定目标的不同被分为了队形的保持与切换、障碍物的规避和碰撞的避免,这些行动都被设置了特定的触发条件,当编队车辆自身的传感器接收到的环境信号满足触发条件时,车辆会根据输入的刺激信号做出期望反应即产生输出信号,常见的输出信号为方向和运动速度向量[9]。

对于智能车辆行动选择方案的设计,需要考虑以下两点因素:一是考虑编队车辆在执行任务的过程中会遇到的一般情况和特殊情况;二是考虑将智能车辆能否执行相应任务作为方案限制。对于智能群体行动选择机制的研究主要包括三种方法:行动抑制法、加权平均法和模糊逻辑法[10]。尽管各个行动之间是彼此独立的,但有时不同行动的发生时间会发生冲突,行动抑制法则旨在按照设定的规则对不同的行动编排优先级以解决冲突问题,当冲突发生时优先级高的行动抑制优先级低的行动。加权平均法是一种通过计算行动的重要性来决定行动选择的方法,得到的选择结果与预期匹配度较高,其作用机制则是给不同行动的矢量输出乘以一定的权重并将其求和,得到的权值大小代表了相对应行动的重要程度,再经过正则化后作为编队群体的输出。模糊逻辑法则是加权平均法的进一步演变,在不同的场景下为行动的输出赋予不同的权重大小,并且根据规则构建模糊判别函数,根据判别规则综合不同行动的输出,最终确定编队群体的行动。行动选择法是一种分布式控制策略,具有可扩展规模的特性,智能体向其他智能体传输信息,根据获取的信息进行行动的抉择,编队群体的队形控制具有明显的反馈特征。但是基于行动选择法的行动控制难以量化,导致其在稳定性等性质分析上难以进行。

2.2 人工势场法

人工势场法来源于物理学中的电子在电场中运动,该方法假设构造一个虚拟力场,力场中包含的主要要素有智能体、目标点和障碍物,其中力的产生和强弱规则的制定如下:虚拟力场中的目标点对智能体产生吸引力,智能体离目标点越近吸引力越弱;而力场中的障碍物则对智能体产生排斥力,并且智能体离障碍物越近排斥力越强。智能体同时受到吸引力和排斥力的作用而将沿着势能最小的方向运动[11],在势场力的控制作用下多智能体形成编队。但是不同的编队队形对势场函数的定义要求是不同的,势场函数的设计也较为复杂[13]。

人工势场受力示意图如图4 所示:

图4 人工势场受力示意图

比如有学者提出引力势场函数为[12]:

其中参数Ka为引力势场常量,qi为位置矢量,qgoal为目标位置。

斥力势能函数定义为:

其中常数Kr为斥力势能场常量,函数斥力势能场影响的范围有距离阀值r0控制。

2.3 虚拟结构法

当编队在队形保持的情况下进行整体移动时,关键是保持每个车辆的相对位置不变。为解决这个问题,引入了虚拟结构(Virtual Structure)的概念[14-16],将每辆车看作是一个刚体结构上相对位置固定的点,将整个队形看做是虚拟的刚性结构,车辆跟踪虚拟的结构点运动。刚性结构体的特点是整体的位置在其运动的过程中会发生变化,但是结构体上每一个点的相对位置并不会改变。若将编队队形的保持问题用虚拟结构体来模拟,即将刚体上的若干点看作是智能体,即刚体在空间中运动时,尽管智能体群的位置发生了变化,但是在以刚体作为参考的坐标系下智能体群的位置是没有改变的,多智能体保持不变的几何形态运动,构成了一个假想的刚性结构,即虚拟结构。虚拟结构法将多智能体的编队问题转换成了跟踪问题,智能体群将跟踪虚拟结构上经过对队形计算分析得到的相应期望点,来实现队形的保持。但是虚拟结构法实现的跟踪轨迹是通过对队形进行分析得到的,并且轨迹的获取需要参考其余智能体的位置信息。虚拟结构法具有较高的控制精度和对队形进行反馈的特点,能够较好地控制编队群体地整体行为,但是其对系统的通信质量和计算能力有较高的要求。

2.4 基于复拉普拉斯矩阵的多维队形控制方法

拉普拉斯算法已经从实数域扩展到了复数域,目前的研究在二维以及更高维的编队控制领域取得了丰硕的成果。

将多智能体系统看作一个图G(如图5 是一个有5个节点的图),每个智能体对应图的一个节点[17]。对于一个有n个节点的图G,拉普拉斯矩阵是一个n×n维的实矩阵,复拉普拉斯矩阵的定义沿用了实拉普拉斯矩阵的定义方式,在此基础上加入了复数:

图5 有5个节点的图

将实拉普拉斯法应用于一维的编队场景中,智能体群能实现编队的前提条件有两种:第一种是当且仅当该拉普拉斯矩阵有一个零特征根;或者是存在一个根位于编队队形关系图中,并且可以从该根到达所有其他节点。

林志贽教授所带领的团队不仅对实数拉普拉斯矩阵进行了相关研究,该团队还利用复数拉普拉斯矩阵在多智能体编队领域进行了研究,引入了无向和有向的拓扑结构,并且提出了相似编队的概念[18],当且仅当在拉普拉斯矩阵L有一个关于特征向量的零特征值的条件下,所描述的框架是相似的。基于前期研究,林志贽教授所带领的团队还将多智能体的队形控制问题应用到了切换拓扑网络结构中[19]。该团队将无向拓扑结构引入后,利用复拉普拉斯矩阵和空间拓扑结构对编队队形控制问题进行了刻画。该团队的另一项研究成果是基于复拉普拉斯矩阵设计了以相对位置信息为基础的队形分布式控制方法。由于编队群体传感能力受限、环境复杂度等问题,该团队还将研究扩展到了基于有向拓扑结构的多智能体队形控制问题。

2.5 领航跟随者法

领航跟随者法中的领航者是编队中被指定的某一智能体,其他智能体通过获取领航者的运动信息(位置和方向等)来设计自身的运动轨迹从而达到追踪领航者的目的。目前领航跟随者法主要被分为以下三类:令领航者和跟随者保持相应的距离和角度的方法被叫做l-φ控制方法;设定两个领航者,并且设定跟随者以一定的距离关系跟随领航者的方法被叫做l-l控制方法;一种更为灵活的控制策略叫做l-φ-l混合控制方法,基于该控制方法跟随者既可以以l-φ控制方法追踪领航者,也可以按照l-l控制方法来设定两个领航者[20]。

以美国宾夕法尼亚大学的Kumar 教授领导的GRASP团队对领航跟随者法进行了大量深入的理论研究以及实验验证[21],实现了多智能体任意队形的切换。该团队提出了使跟随者不仅受领航者的引导,而且还与编队中其余智能体进行信息交互并协同运动的控制策略,即合作跟随领航者法[22-23]。后期又有学者基于领航跟随法提出了虚拟领航者方法,即设置与编队成员运动状况完全相同的虚拟领航者作为编队的领航者,防止发生因领航者失能编队队形失控的现象。

多种队形控制方法的结合也是一种很好的队形控制策略。目前有许多的学者进行了这方面的研究。如结合领航跟随法和人工势场法的结合[24],领航跟随法和虚拟结构法的结合[25],基于行为的领航跟随者法[26]等。多种方法的结合可以互相弥补不同方法的缺点,使控制策略更加的完美。

3 队形控制应用场景

根据车辆的行驶环境,可以将编队控制的背景分为两大类,一类是有道路限制,就是车辆需要按照已有的道路轨迹行驶,在进行队形的控制时需要考虑道路限制对编队的影响;第二类是无道路限制,此时编队的行驶轨迹和编队中每个车辆在队形变换的过程中的行驶轨迹是不受道路限制的,但需要考虑路面障碍物对编队整体及编队内车辆的影响。下面将详细介绍两种应用场景。

3.1 有道路限制应用场景

如图6 所示,公路卡车编队是一种典型的有道路限制的编队控制应用场景。公路卡车编队运行可以降低驾驶员的劳动强度,降低车辆油耗,减少卡车安全事故,降低运输企业的成本。卡车编队一般控制目标是尽可能缩短车辆之间的跟车距离,使跟随卡车以最小的行驶风阻以达到省油的目的。国内外目前多家企业开展了卡车编队的研发,沃尔沃公司率先研发列队行驶;大陆集团与克诺尔合作进行商用车编队行驶项目测试;2018 年丰田通商、日野、五十铃等日本四家卡车公司做了约15 km的编队行驶实证实验;2019 年戴姆勒开始自动卡车高速公路测试工作;一汽解放青岛港展示了国内首个卡车智能编队行驶运营。

图6 卡车编队

3.2 无道路限制应用场景

以俄罗斯、美国、中国为代表的国家在发展无人战车技术上有了一定的成果[27-28],并且俄罗斯也已经在叙利亚战场上开始应用无人战车作战;同时未来战场作战环境发展趋势将是信息化和非接触的,而集群协同作战可显著提升探测、突防、打击等效能,是未来体系化、网络化协同作战的制高点技术。综合以上所述,多无人战车集群控制将是车辆编队控制的热点研究内容,也是一种典型的无道路限制智能车编队应用场景。未来无人战车编队集群与无人机的异构编队控制将是重要的研究方向,也将在未来战场上发挥重要作用。

图7 无人战车及无人集群作战

4 未来研究方向

编队队形控制问题的相关理论研究取得了丰硕的成果,但实际应用尚有欠缺,控制相关理论和实际的结合和应用差距还较大。目前大部分的理论研究都是基于线性模型展开,但是车辆作为一个复杂的非线性系统,基于线性模型得到的理论成果并不能直接应用于智能车,如何利用已有研究成果探索编队控制问题也面临挑战。目前的理论成果对于小规模系统控制有着很好的效果,但是如何解决大规模系统的编队控制也是值得研究的问题。分布式的控制策略对于解决大规模编队控制有着很好的效果,但是针对小规模系统的编队控制应如何悬着集中式还是分布式控制策略,什么样的场景应该如何选择控制方法和控制策略也是需要考虑的问题。

猜你喜欢
领航者拉普拉斯队形
渔船的“领航者”和“安全卫士”
“益源庆”打造中国高品质食醋领航者
队列队形体育教案
诗歌的奇怪队形(一)
IC访谈:“智慧政府”领航者——新华三集团
做纯棉数码印花领航者
基于超拉普拉斯分布的磁化率重建算法
无人机编队机动飞行时的队形保持反馈控制
位移性在拉普拉斯变换中的应用
含有一个参数的p-拉普拉斯方程正解的存在性