多AUV集群控制技术综述

2020-11-29 10:58孟中祥刘时圆吕珍斌

数字海洋与水下攻防 2020年6期

关键词：分布式集群文献

孟中祥，刘时圆，吕珍斌

（中国船舶重庆前卫科技集团有限公司，重庆 401120）

0 引言

自主式水下机器人（简称 AUV）可以应用于海洋中的多种任务场景，但单个AUV容错率低、作业效率不高，将多个AUV有机地组成一个整体，应用基于智能体的集群控制技术，执行任务时相比于单个AUV执行有着无与伦比的优势。

集群控制关键特点[1]可以归纳为如下3点：

1) 核心控制思想是协作协调。个体之间保持通讯交互、协作协调完成任务。

2) 控制方式是分布式控制。只能与邻居进行信息交互，而不能与非邻居的智能体建立通讯关系。

3) 不同的个体对某一确定的物理量，如位置或速度达成一致。

集群控制的研究可归纳为一致性问题和覆盖控制问题 2类基本问题[2]。“一致”意味着聚合，即所有智能体的状态最终将收敛到一个共同的目标状态；而“覆盖”意味着分散，即所有智能体的状态要尽量散开以获得良好的空间覆盖效果并且互不干扰。当AUV集群编队航行时要考虑位置、速度的一致性问题，内部的相对运动则需要考虑避碰规划的覆盖控制问题。

在水雷战术中，水雷布防可以视为覆盖控制问题，多AUV扫雷可以视为一致性控制问题。本文结合集群控制技术的发展现状，介绍了集群控制理论的主要研究内容和多AUV技术集群控制技术现状，对AUV集群技术的未来发展给出了建议，对行业未来的影响进行了展望。

1 集群控制技术

1.1 集群控制技术概述

集群控制技术发展源于大量无人机飞行技术。技术人员幻想无人机可以像生物系统的鸟群一样实现无人机自主集群。法国动物学家 Grasse基于白蚁筑巢行为[3]，提出了共识自主性（stigmergy）概念：即不需要通过集中规划和直接通信，通过个体间的间接协调就可以完成复杂的智能活动。

集群控制技术相对于传统的多个体协同控制最大的特点有4个方面：1）数量级，集群一般指几十到上百个个体；2）成本，集群内的个体成本造价低廉，允许系统承受损失，可大胆使用；3）技术优势，对智能传感、环境感知、分析判断、网络通信、自主决策的技术要求极高；4）环境适应性，自主集群对复杂的突发状况可以进行复杂的协作、动态调整和自愈组合。

1.2 国内外集群技术发展现状

美国致力于打造无人装备自主集群系统，美国国防高级研究计划局2005年在集群高风险/高回报概念验证中将自主控制等级分为10级，包括单机自主（遥控引导，实时故障诊断、故障自修复和环境适应性、航路重新规划）、多机自主（多机协调、多机战术重规划、多机战术目标）、集群自主（分布式控制、群组战略目标、全自主集群），指出全自主集群是自主控制的最高等级[4]。2016年，美国空军对蜂群、编组、忠诚僚机3种集群作战概念进行了阐述[5]。

北京航空航天大学仿生自主飞行系统研究组10余年来，通过借鉴雁群、鸽群、鸟群、狼群、蜂群、蚁群的共识自主性集群智慧，采用分布式策略设计了无人机集群自主控制方法和技术，进行了无人机集群编队、目标分配、目标跟踪、集群围捕等任务的飞行试验验证[6]。国内无人机灯光秀表演正热，如2018年2月珠海春晚无人机特技飞行，2018年8月长沙橘子洲头777架无人机灯光表演。但以上集群表演主要用了高精度的定位技术，距离复杂环境下的集群控制技术还有很大差距。总的来说，集群控制理论研究和技术应用发展火热，但其技术条件还远未成熟，具有相当大的技术空白和不对称发展的前景。

1.3 集群作战技术

利用集群系统进行作战的主要技术优势就是去中心化，任一个体故障都不影响群体能力，而且具有较低的决策门槛和政治风险，可用于渗透侦查、诱骗干扰、饱和攻击、察打一体等任务。集群作战的兵力补充方便，新的无人装备要加入作战系统时，只需要与周围的无人机建立通讯就可以快速融入系统。

在集群作战技术快速发展的趋势之下，各国开始投资发展反集群作战技术。2018年3月，美国陆军在俄克拉何马州西尔堡举行了机动火力综合试验，利用高功率微波武器和高能激光武器击落了 45架无人机集群[7]。反制措施包括：捣毁峰巢，即在投放区域外进行拦截，密集拦截，即采用弹炮融合和密集火力防空炮进行拦截、集群对抗；电磁瘫痪，即用定向能武器进行抗击或电磁干扰、控制劫持等。

2 集群控制研究内容

2016年 8月，美国国防部国防科学委员会发布了《人工智能与国家安全》，指出了人工智能技术是国家安全的颠覆性技术[8]。群体智能就是受自然界生物群体模式启发的一种人工智能模式，集群的意思简单来说就是模拟一大群行为相近的单位的行动[9]。

1987年，Reynolds等人对鸟类飞行行为进行了研究[10]，提出了3条启发类规则即避免碰撞、速度匹配、和保持聚集，建立了集群行为的Boids模型。1995年，Spector提出了改善swarm模型并进行了仿真，通过设定不同的权重系数，得到了丰富的控制效果[11]。现如今研究者们普遍达成共识，集群行为应该体现出组织结构的分布性、行为主体的简单性、强适应性，如遇到危险时可以迅速做出集体逃避动作。

集群的运动方法有2种：第1种是平均行动向量的算法，即先规定每个单位有一个视野范围，每个单位的移动方向，都是它自己视野范围内的平均移动量；第2种是势能函数法，即通过模拟物理学中分子间的力的关系，通过引力或者斥力来移动，对于集群和分布式的理解可以简单而明了。集群可以理解为一个业务部署到多个服务器上，而分布式则是一个任务分拆成多个子任务，可以认为集群是物理形态，而分布式是工作方式。

集群控制需要图论基础，任意一个智能体都与它周围的邻居智能体通过相应的连接拓扑实现通讯交互，抽象为数学语言就是一个拓扑图。拓扑图清晰具体地反映了智能体之间的通讯交互关系，任何控制协议都必须按照其规定的图拓扑结构进行分布式控制，每个节点的控制协议只允许依赖于关于该节点及其在图中的邻居节点的信息[12]。

集群控制一般都需要领航者，原因在于当需要做出地图的寻路算法时，需要一个队长来做出寻路和判断的算法，这样可以大幅度减少计算量[13]。当一个个体不能工作时，其它个体检测不到其信号会自动填补其位置，如果有新的集群要加入，只需要和边界的无人机建立通信即可，这种简单的功能在集群尺度上表现出了自愈的能力[14]。集群智能的核心概念是共识主动性[15]，正如同蚁群中的个体都没有建造的基因和计划，但通过识别其余个体的信息素共同完成了巢穴建造。

从控制理论的角度来说，控制集群的行为就是用正反馈和负反馈 2个最基本的内在要素来促使系统应对外界的变化，正反馈对应于快速性，负反馈对应于稳定性。然后通过博弈论[16]、神经网络[17]等方法来对个体行为模式的复杂性进行训练以达到研究者的目标，从而最终达成集群的群体智能行为。

3 集群控制关键技术

集群内个体的局部运动规则是预先定义好了的，学者们提出了间接控制的方法[18]，即通过对集群中加入可控个体，间接进行外部控制。鉴于现实世界中存在领导者，受此启发，很多学者都提出了领导者或者虚拟领导者角色，即领航者[19]。领航者是一类特殊的智能体，其它智能体都尽可能地跟随领航者，按领导者的性质可划分为真实领导者和虚拟领导者。前者跟踪的领导者是真实的目标，这种方法主要应用于移动传感器网络和分布式跟踪问题中。而后者跟踪领导者是预定参考运动模型，文献[20]研究了具有多个领导者的包含控制问题，文献[21]研究了具有参数不确定性的网络化拉格朗日系统的分布式包含控制问题，提出了与分布式自适应控制算法结合的分布式滑模估计器。以上研究方法对集群控制中领航者的设计和研究方法进行了介绍，并从不同的方面进行了部分扩展，在分布式结构方面进行了挖掘，提升了系统的鲁棒性。

在集群控制算法的研究中，收敛速度是衡量一致性控制算法性能的重要指标，研究有限时间一致性问题具有重要的现实意义。文献[22]提出了2个分布式控制协议使得一阶多智能体系统在有限时间内达到一致，将此一致性协议扩展应用到多智能体系统的编队控制中。文献[23]研究了多智能体系统的有限时间一致性问题，用 Lyapunov函数为每个智能体构建了全局非线性一致性协议，并且对于任意的初始条件系统均能在有限时间内达到一致。文献[24]以滑模变结构理论研究了多机器人系统有限时间跟踪一致性问题，该方法对输入扰动具有鲁棒性。以上研究从不同的方面给出了控制时域内、有限时间内收敛这一关键技术指标，为设计集群控制方法给出了有力的支撑。

在通信方面，各个智能体实际应用时只能获得部分信息甚至得不到对方的信息。为此，研究者们引入了基于状态观测器的方法，文献[25]针对多智能体系统设计了观测器，奠定了多智能体系统观测器设计的基础。文献[26]研究了一阶多智能体系统的领导者跟随一致性问题，引进了观测器来估计领导者的速度，并构造了一个通用的Lyapunov函数分析了系统的稳定性。基于观测器的估计方法不依赖于实时传感器信息，且以上研究缺少数据融合算法，单一状态估计器信息难以保证状态信息的可靠度。

集群系统以一个行为目标来规划运动方式，也就是说控制的结果可以用一个目标函数来表示，因此可以用最优控制的方法来进行控制器设计。最优控制的研究方法有线性二次调节法（Linear Quadratic Regulator，LQR）、模型预测控制（Model Predictive Control，MPC）、微分博弈（Differential Games）、自适应动态规划（Adaptive Dynamic Programming，ADP）等。在以上方法中LQR适用于线性系统，设计过程是离线的；MPC是在线算法需要连续采样和实时预测；微分博弈是最优控制与博弈论的结合，可得到集群系统的纳什均衡，但是会引入“维数灾难”问题；ADP最优化方法是利用如神经网络的方式来逼近动态规划中的性能指标函数以达到最优，可以看出上述方法各有优缺点，现如今的研究趋势是组合各种先进的控制算法进行研究。文献[27]提出了基于神经网络的自适应方法，通过神经网络近似系统的动力学方程，利用自身及其邻居之间的相对状态信息为各个智能体设计出了自适应神经网络控制器。文献[28]将一致性和最优性理论结合在一起考虑，将自适应动态规划与微分博弈结合解决了一般线性多智能体系统的一致最优控制问题。以上研究方法在解决单一优化目标时考虑到了一致性的问题，使用的神经网络、博弈等方法各有其优劣性，值得进一步地深入研究。

在避碰任务规划方面，文献[29]利用计算几何中的维诺图理论，将任务环境划分成多个互不重叠的维诺单元，通过 K-均值聚类算法连续迭代生成质心维诺划分，并设计相应的分布式覆盖控制器，智能体只在自己的维诺单元内移动，从而避免碰撞。文献[30]设计了一个分布式梯度优化算法，驱动每个智能体朝着最大化目标函数的方向移动，驱动器避开障碍物等多种情况。人工势能函数[31]使得每个智能体遇到障碍物和邻居智能体时能够产生排斥力，迫使智能体分散开来，覆盖整个任务环境。类似的方法还有虚拟力算法[32]、反蜂拥模型区域覆盖算法[33]。这些方法的最大特点是利用虚拟的吸引力和排斥力来设计分布式控制器。计算机领域的研究者还从信息论的角度提出了区域最优覆盖算法[34]。

以上集群控制方法都存在各自的局限性和优点，依靠单一控制方法来进行集群控制结果是不理想的。将人工智能法和势能函数法进行结合，是目前集群智能控制研究的趋势，目前文献研究的都是针对初始条件的集群环境，外部干预控制和集群控制完善也是一个重要的课题，各种先进的控制算法的发展也可以提高群智能行为模式，学科结合和学科交叉也可以提供技术解决方案。

4 AUV集群控制技术

AUV 在执行任务过程中，往往是沿着预先规划好的路径前进的，应用于任务规划主要有人工势场法、匹配法和图形搜索法等。人工势场法是在AUV的目标位置周围定义一个虚拟的引力场，而在障碍物周围则定义一个虚拟的斥力场，引力场和斥力场会对场中的AUV产生引力和斥力作用从而决定AUV的运动[35]。匹配法[36]将当前的状态与过去相比较，找到最接近的状态，就可得到一条新的路径，按照有无碰撞发生，将区域划分为自由空间和限制空间，在自由空间内再根据某一准则确定最优路径。图形搜索法[37]可用于多AUV的扫雷任务，该算法根据各AUV的起点和终点来为其画一个椭圆，椭圆里面的区域就是相应AUV所要执行任务的区域，再根据这个区域里面各个水雷的位置，对单个 AUV采取一定的优化算法来求取最短的路径。文献[38]利用进化算法来对多 AUV的路径进行优化设计。文献[39]提出了一种基于交通规则的多机器人避碰规划。该方法根据交通规则来解决机器人之间的协调避碰问题。文献[40]提出了一种基于协商和意愿强度的避碰规划，该方法通过定义机器人行为意愿强度来解决机器人多种行为的综合问题。文献[41]讨论了在受到环境约束条件下，如何安全地形成所希望的编队形状。文献[42]采用虚拟领队的方法对多机器人编队的协调控制进行研究：虚拟领队用来控制整个队伍前进的方向，队伍中的各个机器人成员之间均定义了人工势场，以确保它们之间保持安全的距离。以上方法针对 AUV的集群运动控制探讨了多种情况，使用的研究方式新颖，技术可行性较高，具有很高的参考价值。

通过通信，系统中的各AUV就可以了解其它AUV的意图、目标和动作以及当前环境状态、自身所处整体的位置等信息，从而进行有效的磋商，协作完成任务。通信技术是AUV集群控制的关键技术之一，文献[43]开发了网络通信协议用于多AUV协调定位和通信。通过测量AUV间的信号延迟和互换各自的定位地图来实现AUV间的相互定位。文献[44]提出了一种自主式水下系统网络，网络中的每个节点都可作为一个单独的路由器，网络的拓扑形状随着 AUV数量的增加或减少而发生改变。以上研究方法考虑了实际通信系统中的复杂性和不可控因素，使得通信系统的鲁棒性得到了提升。

AUV在军事上一个重要的用途是利用其携带的主动式声呐对水雷进行探测直至清除。文献[45]提出将多个AUV组成的编队用于水下扫雷。整个AUV群体由一领队进行集中协调，以覆盖最大的扫雷区域。当某一AUV在扫雷任务中“牺牲”后，领队将对剩下的任务进行重新分配。文献[46]提出了一种基于生物行为的智能控制系统并将其应用到多AUV的协调控制中。中科院沈阳自动化研究所在仿生机器人研究上面也取得了一些突破[47]。以上研究成果在水雷战上都具有相当大的应用前景，直接给出了AUV扫雷军事用途的军事应用前景和技战术指导，值得水雷行业技术人员和行业领军者们关注。本文所综述的各种先进的鲁棒控制[48]、动态控制[49]、最优控制算法[50]、通信方案[51]等都可以为技术应用提供解决方案，具有相当大的发展前景。若能进行立项，使得更多行业内从业人员具备研究条件，对该控制方法进行深度的挖掘，相信可以给行业的发展带来颠覆性的改变，带来新的关注焦点和认知转变。

无人自主系统式人工智能的重要应用，已经成为国家重大战略，集群控制技术的发展不能仅仅停留在理论研究上面，未来的发展应该结合产业现状，对未来的发展建议有：

1）借鉴军事强国技术研发模式及无人机集群作战样式，举办AUV集群大赛，将其纳入装备体系整体规划，提高多AUV集群系统在复杂环境下的实际执行任务能力和抗干扰能力，加强系统间的对抗演练，提高系统的作战能力。

2）探索未来水下装备智能集群作战概念，重视军民融合，以作战任务需求出发，重视先进控制算法和理论，重视平台、通信、计算、有效载荷协调发展，统筹规划多AUV系统发展。

3）着眼交叉学科的技术发展，关注突破颠覆性技术，重视生物学、控制论、人工智能、机器人学科等学科交叉的前沿技术研究。

4）注重国防安全应用研究，确定出无人机、无人车、无人艇、无人潜航器等跨域无人平台构成的无人体系。在民用方面，了解用户需求，促进技术发展和应用转化，不可让先进的控制方法研究停留在理论层面，应该在实用进程中展现其生命力。