杂波环境下可移动主被动传感器长时调度方法

2023-02-11 12:29李召瑞
系统工程与电子技术 2023年1期
关键词:调度精度传感器

安 雷, 李召瑞, 吉 兵

(陆军工程大学石家庄校区电子与光学工程系, 河北 石家庄 050003)

0 引 言

现代化作战条件下,受限于复杂的电磁空间环境,各类目标侦测传感器作用的发挥高度依赖于资源调配及信息融合,传感器调度技术成为了目标跟踪的研究热点[1]。而由于被动传感器所具备的不向外辐射信号、角度测量精度高的特点[2],以及可移动运载平台在风险规避能力上的优势[3],研究提出适用于可移动主被动传感器系统的调度方法,能够有效提升目标跟踪精度、降低使用代价、改善传感器系统的生存能力。

以雷达等为代表的主动传感器,通过向外辐射电磁波等能量信号,从而获取目标的空间位置和运动状态等信息。但辐射告警接收机的应用,可以帮助目标截获辐射信号,识别传感器身份并锁定其位置,进而实施攻击[4]。所以,对主动传感器来说,跟踪目标时存在一定辐射风险,并将因辐射风险而产生的使用代价称为辐射代价[5]。

针对辐射风险控制的传感器调度方法,主要是在保证目标跟踪精度的基础上,通过调配传感器资源或者实施平台机动的方式,避免高辐射风险传感器的使用或使传感器处于高辐射的工作状态。要实现对辐射风险的有效控制,首要的是对其进行准确的量化[6]。文献[6-7]将传感器一个工作时长内的辐射风险量化为固定值,但由于辐射风险非线性变化的特征,这种方法并不准确。文献[8]则基于双方传感器的发射功率、脉冲宽度和采样时间等参数,计算一方传感器被另一方截获的概率,将截获概率与截获代价的乘积定义为截获风险,以截获风险作为辐射风险的衡量指标。文献[9]在调度中采取辐射度影响(emission level impact, ELI)模型量化传感器辐射风险,反映了其非线性变化的特征,相比于文献[8]中的截获风险,无需提前掌握对方设备参数,但ELI状态及辐射风险等级均由人为确定,与主动传感器的实际工作特征不符。

在面向目标跟踪的传感器调度中,系统首先基于先验信息预测优化指标,并以此为依据决策选取最优调度方案,执行调度方案获得目标量测信息,再依靠滤波算法得到目标估计状态,同时反馈到下一阶段决策。这其中,优化指标的预测和目标状态的估计,都依赖于目标跟踪算法的应用。而在实战环境下的目标跟踪中,由于目标数量众多,难以做到完全观测,且环境中还包含杂波干扰,导致跟踪存在较大的不确定性[10]。为此,经典的多目标跟踪算法如联合概率数据关联(joint probabilistic data association, JPDA)算法[11]和多假设跟踪(multiple hypothesis tracking, MHT)算法[12]等,采取数据关联的方式来解决不确定性问题,导致调度方案求解变成了非确定性多项式难题,计算量大,反应速度慢,无法满足目标跟踪时效性的要求。针对这种情况,Mahler基于随机有限集(random finite set, RFS)理论,首次提出了有限集统计学(finite set statistics, FISST)[13],形成了一种可适性好的多目标多传感器系统统计模型,并在此基础上,简化多目标贝叶斯滤波求解复杂性,提出了概率假设密度[14](probability hypothesis density, PHD)滤波器、带势PHD[15](cardinalized PHD, CPHD)滤波器、多伯努利[16](multi-Bernoulli, MB)滤波器及其改进等多目标跟踪算法,省去了复杂的量测-航迹关联环节,实现了比经典算法更好的跟踪性能。

进一步,学者们将基于RFS的多目标跟踪算法与传感器调度相结合,文献[17]针对可移动单传感器控制问题,以最优子模式分配(optimal subpattern assignment, OSPA)距离为跟踪精度衡量指标,采取标签多伯努利(labeled MB, LMB)滤波器估计目标状态,显著提高了跟踪精度。文献[18]采取高斯混合多目标(Gaussian mixture multi-target, GM-MT)滤波算法,利用不同高斯分布之间的巴氏距离求解高斯混合(Gaussian mixture, GM)之间的信息增益,提出了以单步OSPA距离最优为准则的传感器控制策略。

上述两种调度方法,针对跟踪精度这个单指标的优化问题,均采取短时调度的方式得到了控制方案,但对辐射风险进行优化时,由于跟踪精度和辐射风险之间相互矛盾的关系,单纯地进行最优化调度,将导致跟踪精度严重降低,这就要求在调度中必须以两者的有效平衡为优化目标。文献[19]针对传感器网络多目标跟踪中的节点调度问题,在节点数和跟踪精度双重约束的前提下,以节点调度代价和网络传输代价最小化为优化目标,提出了一种基于单步代价的传感器短时调度策略。但短时调度的决策依据仅为单步收益,虽然单指标最优化的性能突出,却不能很好地满足多指标平衡的要求,相比之下,长时调度的决策依据为一段时间内调度收益的总和,平衡优化性能要优于短时调度[20]。文献[21]针对空战中飞行器跟踪精度与辐射风险的平衡问题,以多步累积发现概率、累积被截获概率为决策依据,实现了机载多类型传感器的有效协同。文献[22]以传感器能量损耗为约束条件,利用基于δ扩展LMB(δ-generalized LMB, δ-GLMB)滤波器实现目标状态估计,采取子最优算法求解调度方案,提出了一种约束条件控制下的多传感器调度算法。

针对上述问题,基于可移动主被动传感器系统多目标跟踪场景,提出了一种辐射控制的长时调度方法。主要工作如下:首先,基于部分可观测马尔可夫决策过程(partially observable Markov decision process, POMDP)[23]和RFS理论,建立多目标状态模型和量测模型。其次,基于GM-PHD[24-25]滤波算法实现多目标长时跟踪精度的预测,基于改进的辐射风险量化方法实现传感器长时辐射代价的预测,在此基础上,利用改进的灰狼优化算法求解调度方案。最后,采取Joint-GLMB[16]滤波算法处理目标量测信息,得到目标估计状态。

1 调度问题描述及模型构建

如图1所示,在平面直角坐标情况下,由多部基于可移动平台的主被动传感器对多目标展开跟踪。假设目标进行近匀速直线运动,传感器系统由N个可移动平台组成,每个平台上包含1部主动传感器(雷达)、1部被动传感器(红外探测器)。由于主动传感器观测目标时存在辐射风险,会被目标识别甚至锁定位置,为提高传感器系统生存能力,实现对多目标的准确跟踪及传感器系统辐射风险的有效控制,展开相应的调度方法研究。

图1 基于可移动平台的主被动传感器系统工作示意图Fig.1 Working diagram of active/passive sensor system based on mobile platform

1.1 多目标状态模型

定义k时刻多目标运动状态:

(1)

Xk+1=Sk+1|k(Xk)∪Bk+1|k(Xk)∪Γk+1

(2)

式中:Sk+1|k(Xk)表示k+1时刻的存活目标RFS;Bk+1|k(Xk)表示由存活目标Xk衍生目标的RFS;Γk+1表示k+1时刻的新生目标RFS。根据文献[24],各目标的运动特征服从线性高斯多目标(linear Gaussian multi-target, LGM)模型,则目标马尔可夫转移概率密度满足:

(3)

1.2 多目标量测模型

传感器系统观测多目标得到的状态定义如下:

(4)

Zk=Dk(Xk)∪Kk

(5)

由于传感器量测模型也必须服从LGM,故多目标量测似然为

(6)

式中:Hk为量测矩阵;Rk为量测噪声协方差矩阵。

由于主被动传感器的工作特性,k时刻主动传感器n1观测目标m得到的量测信息包括目标斜距离和方位角:

(7)

而被动传感器n2观测目标m得到的量测信息仅有方位角:

(8)

1.3 基于截获概率的辐射风险量化方法

(9)

(10)

同时,由于截获概率α[28]的定义为

(11)

(12)

式中:B为辐射风险量化系数。

1.4 传感器系统调度动作及目标优化函数

(13)

式中:vs,c是传感器的控制速度;jk表示平台的机动方向选择;lk表示平台的机动速度选择;机动方案共有NRNθ+1种(包含传感器不动),则qk的取值为

(14)

NR=2、Nθ=8时的传感器平台机动方案如图2所示。

图2 NR=2、Nθ=8时的传感器平台机动方案Fig.2 Maneuvering scheme of sensor platform while NR=2、Nθ=8

基于平衡目标跟踪精度和传感器辐射风险的目的,构建目标优化函数:

(15)

2 传感器系统长时调度方法

在调度模型的基础上,按照指标预测、决策求解、方案执行的流程,借助RFS多目标跟踪算法实现目标状态估计,提出传感器系统长时调度方法。该节将介绍改进的灰狼优化算法(grey wolf optimization algorithm, GWO)。同时,从文献[29]中的对比实验可以看出,在各类RFS多目标跟踪算法中,GM-PHD算法虽然得到的跟踪精度一般,但计算所需时间最短,考虑到预测阶段备选调度方案较多、计算量大的实际,采取GM-PHD进行状态估计。而joint-GLMB算法虽然增加了一定的计算量,但目标状态估计准确度却得到了大幅提升,为保证目标跟踪精度,在调度方案执行阶段,利用joint-GLMB滤波计算目标估计状态。

2.1 多目标长时跟踪精度的预测

以OSPA距离作为衡量指标,实现多目标长时跟踪精度的预测。

步骤 1初始化

步骤 2计算目标状态预测值

步骤 3计算传感器平台预测位置

(16)

式中:若2≤qk≤Nθ+1,则jk=1,lk=qk-1;若Nθ+2≤qk≤2Nθ+1,则jk=2,lk=qk-1-jkNθ;以此类推,若(NR-1)Nθ+2≤qk≤NRNθ+1,则jk=NR,lk=qk-1-(jk-1)Nθ。

步骤 4计算目标量测预测值

步骤 4.1被调度平台主被动传感器量测信息融合

(17)

(18)

步骤 4.2未调度平台被动传感器无源定位

(19)

(20)

(21)

(22)

(23)

(24)

步骤 4.3系统量测信息融合

(25)

步骤 5计算目标估计状态预测值

步骤 6计算长时跟踪精度预测值

(26)

2.2 传感器系统长时辐射代价的预测

根据本文所提基于截获概率的辐射风险量化方法,结合第2.1节中对多目标长时跟踪精度的预测,提出传感器长时辐射代价的预测方法。

步骤 1初始化

步骤 2计算被调度平台与目标间的预测距离

(27)

则被调度平台到目标的预测距离为

(28)

步骤 3计算主动传感器辐射风险预测值

(29)

步骤 4计算长时辐射代价预测值

(30)

2.3 改进的GWO

为适应传感器长时调度方案求解的特点,在GWO[31]的基础上,针对狼群初始化和搜索机制进行改进。

步骤 1狼群初始化

假设当前为k时刻,利用改进的灰狼优化算法求取[k,k+h-1]时域内的最优调度方案。规定狼的数量为W,算法迭代次数为It,搜索目标即调度方案为一个h×2维的矩阵:

(31)

式中:P为各时刻的拟调度平台,取值范围为[1,N]内的整数;Q为各时刻拟调度平台对应的机动方案,取值范围为[1,NRNθ+1]内的整数,则搜索空间大小为(N(NRNθ+1))h。

搜索开始前,初始化狼群位置,每只狼的当前位置即其当前搜索到的调度方案,初始位置中每个元素的值为取值范围内的随机整数:

(32)

式中:w∈{1,2,…,W};Λ[1,N]表示一个在[1,N]范围内的随机整数。

当采取随机初始化的方法产生初始种群时,若狼群数量较少,则难以保证较好的种群多样性,但增加狼群数量却会导致计算量的大幅增长。基于此,为提高初始种群的多样性和搜索的覆盖范围,将狼群中两个狼的初始位置分别改为调度方案的下界值和上界值:

(33)

(34)

步骤 2计算适应度值

(35)

步骤 3更新并记录α狼、β狼和δ狼

根据狼群的适应度值Fi,选取并记录α狼、β狼和δ狼,即截至当前迭代次数下适应度值最小的3个狼,其满足Fiα

算法 1 α狼、β狼和δ狼的更新算法while itFiα&FiwFiα&Fiw>Fiβ&Fiw

步骤 4更新狼群位置

由于调度方案求解时,每只狼的位置中所有元素必须是取值范围内的整数,所以将标准灰狼优化算法中每次迭代更新后的位置定义为拟搜索位置,在对拟搜索位置作适应性处理后,再更新狼的位置。拟搜索位置超出边界的,取相应的上下边界值;拟搜索位置在取值范围内的,四舍五入取整。同时,由于狼的位置即当前该狼搜索得到的调度方案为一个h×2维的矩阵,所以基于矩阵中的每个元素对狼的位置进行更新。

(36)

(37)

(38)

(39)

(40)

式中:a为收敛因子:a=2-it·(2/It);ι为[0,1]中的一个随机数。

步骤 5迭代循环

2.4 长时调度方法及流程

在实现长时目标跟踪精度预测和长时辐射代价预测的基础上,根据目标优化函数式(15),采取改进的GWO求解调度方案,依据调度方案更新传感器位置、获得目标量测信息,最后,利用joint-GLMB滤波算法估计目标状态,仿真总时长为H。

步骤 1初始化

步骤 2求解调度方案

步骤 3执行调度方案

步骤 3.1更新传感器平台位置

步骤 3.2获得目标量测信息

步骤 3.3计算目标估计状态

步骤 3.4决策时域内循环

步骤 4循环

若k+h-1≥H,则调度任务结束。

长时调度流程如图3所示。

图3 长时调度流程Fig.3 Non-myopic scheduling process

3 仿真实验及结果分析

3.1 仿真条件设置

目标均采取近匀速直线运动,初始状态分别为M1(0 m,0 m/s,800 m, -14 m/s),M2(800 m, -14 m/s, 0 m,7 m/s),M3(-800 m,14 m/s,200 m, -7 m/s),M4(800 m, 14 m/s,600 m, -9 m/s)。目标存活概率pS,k=0.99,检测概率pD,k=0.98;OSPA距离截止参数c=100,阶参数p=1。将观测环境中杂波干扰的RFS建模成泊松分布,其强度Kk(Zk)=λcVu(Zk),其中u(·)为均匀分布概率密度函数;V=(-1 000 m,1 000 m)×(-1 000 m,1 000 m)为传感器监测区域,λc=3为单位面积内杂波的平均个数。GWO中狼群大小W=10,算法迭代次数It=10。仿真总时间H=100 s,仿真结果为100次蒙特卡罗实验的平均。

3.2 调度方法性能分析

为充分验证本文所提调度方法的有效性,同时与位置固定的主被动传感器长时调度方法(non-myopic scheduling method for active/passive sensor, NAPS),可移动主动传感器长时调度方法(non-myopic scheduling method for mobile active sensor, NMAS),以及可移动主被动传感器短时调度方法(myopic scheduling method for mobile active/passive sensor, MMAPS)进行比较。采取仿真时间内的OSPA距离及其定位误差(简称为OSPA-L)和势误差(简称为OSPA-C)的均值来衡量目标的跟踪精度,采取仿真时间内的累计辐射代价(cumulative radiation cost, CRC)来评价调度方法对辐射风险的控制效果,采用单次仿真即100次采样间隔的运行时间均值(TIME)来评价调度方法的实时性。利用本文所提调度方法跟踪目标,得到的多目标运动轨迹和调度序列如图4和图5所示。

图4 多目标真实运动轨迹和采取本文方法进行调度得到的观测轨迹Fig.4 Real trajectory of multi-target and the observation trajectory scheduled by the proposed method

图5 采取本文方法得到的传感器调度序列Fig.5 Sensor scheduling sequence obtained by the proposed method

累计辐射代价,如图6和图7所示决策时长h=4 s时,在分别采取不同调度方法的情况下,仅对目标跟踪精度进行优化时得到的OSPA距离和仅对传感器辐射风险进行优化时得到的CRC。

图6 仅优化跟踪精度时得到的OSPA距离Fig.6 OSPA distance obtained when only the tracking accuracy is optimized

图7 仅优化辐射代价时得到的CRCFig.7 CRC obtained when only the radiation cost is optimized

为进一步验证本文所提调度方法的优势,决策时长h分别取2 s、3 s、4 s进行平衡优化调度。表1为平衡优化时各调度方法的性能对比,为便于分析比较,通过调整优化函数系数α,使OSPA距离均值保持基本一致。

表1 不同决策时长下平衡优化的调度性能对比

从图6和图7可以得出,相比于长时调度,短时调度(MMAPS)针对单指标的优化效果最好,当仅对目标跟踪精度进行优化时,取得的OSPA距离平均值最低,当仅对辐射代价进行优化时,其取得的CRC最低。但在综合考虑跟踪精度和辐射风险,即以平衡优化为目标的情况下,由于长时调度的决策基础是一段时域内调度收益的总和,其针对多指标平衡的优化效果要优于短时调度。所以在表1中,当OSPA距离均值基本一致的情况下,本文方法PSM在3个决策时长下得到的CRC均要低于MMAPS。

同时,结合前文可知,随着h的增加,长时调度的平衡优化性能将得到改善,最优调度方案下的CRC会进一步降低。但由于搜索空间大小即可选调度方案数量(N(NRNθ+1))h将会呈现指数级的增长,在狼群大小W、算法迭代次数It不变的情况下,GWO性能降低,丢失最优解,如表1所示,调度得到的CRC先降低后增加。可以采取增加W或It的方式来解决这个问题,但由于会导致系统反应时间增加,影响传感器调度的实时性,所以,在使用本文方法进行调度时,决策时长h的选择一般不宜超过4 s。

总的来看,本文方法在保证多目标跟踪精度的基础上,进一步提高了对辐射代价的控制能力,更加满足多指标平衡优化的目的,调度性能最优;适应性、稳定性较好,在不同决策时长条件下,均得到了比其他调度方法更好的优化效果。

4 结束语

本文研究了杂波环境下面向多目标跟踪的传感器调度问题,提出了一种可移动主被动传感器系统长时调度方法。该方法主要分为两个阶段:第1阶段,在实现长时跟踪精度和长时辐射代价预测的基础上,采用改进的GWO,搜索获得最优调度方案;第2阶段,根据调度方案更新传感器平台位置并获得目标量测信息,采用joint-GLMB滤波算法得到目标估计状态。最后,通过仿真验证了所提调度方法的有效性。

猜你喜欢
调度精度传感器
热连轧机组粗轧机精度控制
康奈尔大学制造出可拉伸传感器
《调度集中系统(CTC)/列车调度指挥系统(TDCS)维护手册》正式出版
简述传感器在物联网中的应用
电力调度自动化中UPS电源的应用探讨
超高精度计时器——原子钟
基于强化学习的时间触发通信调度方法
“传感器新闻”会带来什么
分析误差提精度
跟踪导练(三)2