基于DBSCAN算法的PDW数据二次分选方法研究

2019-05-23 07:07刘丽明陈正宁
舰船电子对抗 2019年2期
关键词:门限邻域脉冲

刘丽明,陈正宁,姚 啸

(解放军91336部队,河北 秦皇岛 066326)

0 引 言

脉冲描述字(PDW)是雷达侦察装备对雷达信号脉冲测量结果的数字化描述,主要包括脉冲到达时间(TOA)、载频(RF)、脉宽(PW)、到达方向(DOA)、脉幅(PA)[1]。在雷达信号分选时,PDW是最主要的数据源。由于雷达按照一定重复周期辐射的电磁脉冲在生成、传输、接收和处理过程中会不可避免地出现损失,因此,雷达侦察装备形成的PDW与实际辐射信号的PDW之间存在差异,主要表现为PDW“丢失”,所以,在信号分选过程中,允许PDW适度的“丢失”,避免由此引起分选错误或者丢批增批[2]。

在完成雷达信号分选后,通常还有一部分PDW数据没有参与分选,这些雷达脉冲描述字被认为是无法分选出信号或对分选无用的而被分选模块主动丢弃,但是,其中可能包含高威胁雷达信号的部分信息,如窄波束高转速雷达、低截获概率雷达等[3],因此,必须重视此类数据,从中挖掘出有价值的、能描述敌方威胁雷达的有用信息。由于这些数据已经被具有先验知识的系统认为“无用”,原有的分选准则和方法已经无效,这类数据可能是“片面”的或“局部”的小数据,如果提高分选算法的包容性和分辨力,一定程度上可以避免产生“漏警”[4]。

本文提出的方法是对PDW数据的进一步挖掘,期望发现不满足雷达侦察装备原有分选准则而被遗漏的威胁信号。其主要的思想是按照各类雷达辐射源信号的辐射特征,分析在不同的电磁环境下的辐射源特征参数的细微变化规律,根据电子支援措施(ESM)设备在不同频段范围的测量值和参数测量误差,采用更加宽泛的统计判别门限,通过DBSCAN算法聚类,使看似“无用”的脉冲在较小的累计数值下,分选成新的雷达信号。

1 DBSCAN算法

PDW数据二次处理的目的是寻找“隐藏”在“无用”数据中的,来自于同一个雷达辐射源的一组数据,聚类就是把相似的东西归为一类,这一类数据在参数特征上存在明显区别,分属在不同的目标,因此,可以选择DBSCAN算法[5]。该算法是一种基于密度的空间聚类方法,利用类的高密度连通性可以快速发现任意形状的类[6]。与其它聚类算法的区别是:基于密度聚类可以发现任意形状的簇,对空间数据的聚类具有明显的优势,而基于距离的算法只能发现“近似于圆形”的簇[7]。

1.1 定义[8]

ε邻域:给定对象半径ε内的区域称为该对象的ε邻域。Pmin定义为最低点数。

核心对象:对于给定ε、Pmin,如果对象p的ε邻域包含的对象个数Nε(p)满足:

Nε(p)≥Pmin

(1)

则称p为核心对象。

直接密度可达:对于给定ε、Pmin,当p∈Nε(q),且:

Nε(q)≥Pmin

(2)

则称对象p是从对象q出发直接密度可达的。

密度可达:对于给定的对象集合D,如果存在一个对象链P1、P2、…、Pn,P1=q、Pn=p,对Pi∈D,(1≤i≤n),Pi+1是从Pi关于ε和Pmin直接密度可达的,则称对象P是从对象q关于ε和Pmin密度可达的。

密度相连:如果对象集合D中存在一个对象o,使得对象q、p是从o关于ε和Pmin密度可达的,那么对象p和q关于ε和Pmin密度相连。

簇和噪声:基于密度可达性的最大密度相连对象的集合称为簇,不在簇中的任何对象则称为噪声。

1.2 主要思想

DBSCAN算法的主要思想是:对于构成簇的每个对象,其邻域包含的对象个数,必须大于或等于某个给定的值(Pmin),用户根据目标和实际情况,预先设定ε和Pmin,DBSCAN通过检查数据集中每个点的ε邻域来寻找聚类。如果一个对象q的ε邻域包含的对象数大于或等于Pmin(其它对象到q密度可达),则称该对象为核心对象q,同时创建一个以q作为核心对象的新簇,反复查找从q直接密度可达的对象并将其加入到该簇,直到没有新的点可以被添加;如果一个对象p的ε邻域包含的对象数小于Pmin,则没有对象从p密度可达,点p被暂时标注为噪声点,但会参与到其它邻域的检查。当所有检查完成后,没有聚类到任何一个簇中的对象被认为是噪声数据点,做删除处理[9]。

2 二次分选方法

2.1 工作流程

通常情况下,经过一次分选后,没有参加后续分选的PDW数据量仍然较大。假设在20万脉冲密度/s的情况下(PPS),考虑信号处理过程中高于20%的脉冲丢失,如果有5%的PDW数据被丢弃,也会有8 000个PDW数据可用于二次分选,另一方面,这些PDW数据不具有显著的规律性,需要经过预先处理后才能进行二次分选,主要工作流程包括数据检查、二次处理和结果验证3个环节,如图1所示。

图1 PDW数据二次分选流程

2.2 数据检查

数据检查是对“无用”的、可能“离散”的PDW数据进行预处理,提高参加二次分选的数据的质量。预处理主要检查到达角、频率、到达时间、幅度等值是否超限。一般情况下,这4项不会出现野值。为了减少二次分选的工作量,通过人工干预的方式设置处理门限,用户根据需求或信息支持,设定参数取值范围,从而过滤掉一部分PDW。可以选择的门限主要包括:频率范围、DOA范围、幅度和脉宽,详见表1。

2.3 二次处理

二次处理主要包括聚类、分选2个环节,聚类的

表1 PDW数据筛选原则

过程主要完成对PDW的筛选,将同属于一个辐射源的PDW统一到一个对象集中,分选的过程则是将同一个对象集中的PDW数据识别为雷达信号。

2.3.1 聚类

基于DBSCAN算法,对PDW数据处理的基本流程为[10]:

(1) 选定PDW数据二次处理集Dpdw;

(2) 设置初始聚类参数。在PDW={TOA、RF、PW、DOA、PA}中,选择一个参数作为聚类的参数,建议根据装备实际从TOA、RF或PW中优选,并设定ε领域的半径和Pmin;

(3) 为集合Dpdw中所有的对象进行标记,为“unvisited”;

(4) DBSCAN从Dpdw中任意选择一个unvisited对象p,修改标记为pv(visited);

(5) 根据设定,计算pv的ε邻域是否至少有Pmin个对象,如果小于Pmin,则将pv标记为噪声点pn,否则,为p创建一个簇C;

(6) 将所有ε邻域内的对象放到候选集合N中;

(7) 用迭代的方法,把N中不属于其它簇的对象加入C中,边界点可以指定加入一个簇中;

(8) 在N中任意选取p′,并将其标记由“unvisited”改为“visited”,继续执行(5)~(7)步计算,直到N为空(C无法扩展),此时生成并输出簇C;

(9) 从剩下的对象中任意选择一个unvisited对象,重复(4)~(8),直到所有的对象被访问;

(10) 删除噪声点,处理完成。

图2 聚类的基本过程

2.3.2 分选

将所有簇送分选,分选由雷达侦察装备的相应分机完成,分选算法需要在一次分选的基础上进行适当修正,如将信号建批的最小脉冲数适当变小,将信号重复周期可接受最大值增大等。

2.4 结果验证

结果验证需要查询第1次分选时建立的临时信号表,与二次分选的结果对比,判断2次分选的结果是否存在“同源性”,即来自同一个雷达辐射源,如果存在,则做合批处理,如果不存在,则直接输出。

3 仿真验证

仿真1组PDW数据流,包含1 000批数据,按脉冲出现时序对频率分布进行做图,如图3所示。

图3 PDW频率分布(1 000组)

经一次分选后,有169组PDW数据被丢弃,其频率分布如图4所示。

图4 信号分选完成后剩余PDW

假定来袭方位在165~171之间,威胁目标工作频段为8~12 GHz,信号幅度码大于9的脉冲描述字为有效,则采用DBSCAN算法筛选后的结果如图5所示。

图5 经数据筛选后的PDW

经分选处理,信号分选结果如表2所示。

表2 二次分选结果表

其中,有一个频率点10 548由于仅有1个PDW,不满足分选条件,未输出分选结果。

4 结束语

现代战争中,采用先进技术体制的雷达通常具有参数快变、较低功率、灵活扫描等能力,越来越难以形成足够数量、稳定的PDW,为雷达侦察装备的分选带来了较大的困难。本文提出的PDW二次分选方法,采用了DBSCAN为核心的算法,其运算效率不高,不能应用于大量数据的处理。因此,通过人工干预的方式,利用专业人员的先验知识建立输入门限,对PDW数据进行筛选,从而实现数据的再次挖掘,仿真实验证明,本文提出的方法能够分选出新的雷达信号,一定程度上可以减少漏警的概率。本方法可以在以下2个方面进行改进:一是优化改进DBSCAN算法,提高聚类的效率和准确性[11];二是建立数据检查环节的门限设置模型,减少人为因素导致的输入偏差。

猜你喜欢
门限邻域脉冲
基于非因果滤波和零点法的近断层脉冲型地震动识别方法
基于混合变邻域的自动化滴灌轮灌分组算法
基于规则的HEV逻辑门限控制策略
含例邻域逻辑的萨奎斯特对应理论
融合t-分布随机邻域嵌入与自动谱聚类的脑功能精细分区方法
他克莫司联合超脉冲CO2点阵激光治疗慢性湿疹的疗效观察
激光脉宽对熔融石英中超连续光谱的影响*
基于方向加权多级门限DP-TBD的目标轨迹检测算法
随机失效门限下指数退化轨道模型的分析与应用
基于Neyman-Pearson准则的自适应门限干扰抑制算法*