基于数据场的多模雷达信号分选算法

2018-12-15 07:05冯鑫胡晓曦匡银
电子设计工程 2018年23期
关键词:等势线雷达聚类

冯鑫,胡晓曦,匡银

(中国空间技术研究院西安分院陕西西安710000)

随着现代电子对抗环境的日渐恶劣和战场需求的不断增加,新型综合体制雷达不断投入使用并逐渐占据电子战中的主导地位。综合体制多模雷达是指该种雷达具有多种工作模式可根据战场需求选择不同的模式。由于多模雷达工作模式的多样性,如果采用传统分选算法[1]进行分选,通常会将同一个辐射源不同模式分选为多个不同辐射源,造成“增批”现象。

聚类算法是一种无监督的分类方式,通过特征参数的类内聚集性和类间的分离性进行类别划分,对于缺乏先验信息的雷达信号分选领域有不错的分选效果。国内外的学者在聚类分选领域也做出大量贡献[2-5],但是上述文献将聚类算法运用到雷达信号分选中时都需要事先设定聚类数,无法实现自动聚类。文献[6-10]对K-means算法分别进行了不同的改进之后用于雷达信号分选,与传统算法相比,这些算法收敛速度更快,且能自动确定聚类数目和初始聚类中心。

1 数据场理论

李德毅院士在传统物理场的基础上,提出了基于数据对象的数据场理论。数据空间中的每一个数据对象都通过数据间作用将数据能量从样本空间辐射到整个数域空间所形成的空间场,称为数据场。数据场能够客观地展示数据对象间的相互影响和相互作用。该理论认为数据空间中的数据不是孤立的,而是通过数据场这个客观存在的媒介与其他数据相互作用[11-13]。

1.1 数据场衡量标准

1)场强函数

场强函数是用来描述某数据点的辐射能量值的相对大小的量,考虑到高斯函数具有良好的普适性,而且短程场更适用于聚类算法,因此本文采用高斯势函数描述数据场[14]。场强函数:

式中:ρ反应数据点的数据量,均可作为1来处理;d(x,y)为欧氏距离;σ为辐射因子,取值为常数。

2)势函数

数据场的势是指在数域空间中某一点被其他数据点辐射能量的能量和。根据场强函数可以得到数据场的势函数:

式中:n为数据对象的数目。

1.2 参数σ对数据场的影响

根据式(2)可知,数据对象的作用距离与σ值的大小成正比。若σ值足够小,数据域中每个数据点都相互独立,自成一类。若σ值足够大,整个数据点形成的势场可以认为是只有一个势心的数据点集合。由于上述情况不能准确反映数据点的分布情况,所以如何选择一个合适的辐射因子值对数据场的构建十分重要。

通过改变σ的值,我们能够从不同观测层面上看同一组数据,从而体现人类的动态聚类特性。由实际工程经验可知,首先需要对数据集进行标准化变换,使得各维数据都归一到0~1之间,然后σ的取值就主要取决于数据集的大小,通常σ在数据个数小于1 000时可0.1,当数据集增加一个数量级时,σ可取0.05。本文后面的仿真数据点个数在1 000左右,因此只要σ取值在0.1左右,运算结果对σ就不是很敏感[15]。

2 基于数据场的多模雷达信号分选算法

传统K-Means算法[16-17]应用到多模雷达信号分选中,适合处理大量数据,聚类时间短,但是容易产生“增批”现象。雷达侦察接收机侦收到的雷达信号脉冲描述字(PDW)包含以下5个参数:到达时间(TOA),脉冲频率(RF),脉冲带宽(PW),到达角(DOA),脉冲幅度(PA)中,选择RF,PW,DOA进行分选。图1为多模雷达信号分选流程示意图。

图1 多模雷达辐射源雷达信号分选流程

多模雷达不仅具有一种信号参数变化方式,雷达的频域参数、时域参数与工作模式绑定,变化方也较为复杂,而空域参数中脉冲到达角(DOA)是一个与辐射源位置密切相关的特征参数,它不受雷达信号变化形式的影响,是雷达信号分选最重要、最可靠的特征。同一辐射源不同工作模式情况下的脉冲到达角是相同的。文中首先对侦察接收机截获的PDW数据流进行数据预处理,接着通过数据场势值计算绘制载频和到达角等势线二维图来确定多模雷达信号的初始聚类中心值与聚类数目,通过KMeans算法完成最后的聚类,为后续信号特征参数与辐射源数据库进行比较匹配,进行辐射源识别提供了前提和基础。

2.1 数据预处理

数据样本标准化变换

实际的雷达侦察接收机截获的雷达信号参数比较复杂多样,不同特征参数数据往往不在同一数量级上,为保证数据具有可比性,在聚类分析前,需要对数据集中所有参数维数进行极差归一化变换(也即将数据转换到[0,1]之间的数据),根据如下公式进行标准化处理:

式中Xi(j),i=1,2,...,M为雷达信号样本,M为样本个数,j=1,2,...,N,N为样本维数,为处理后的雷达信号特征参数数据样本。

2.2 数据场确定初始聚类中心

由于数据势场中的势心相当于数域空间内数据集的数据重心,因此可以将数据场的势心看做初始聚类中心,然后进行数据聚类。

等势线的定义描述为将数据场中势值相等的所有点用平滑的线串连起来形成的线。等势线围绕形成的不同中心称为势心。从二维等势线图中可以看出势心的位置,其数学表达式为[8]:

其中,Fy(i,j)为势心附近的势值;(i,j)为数据点的位置;Fmax为势心值;

从公式(4)可知,势心就是数据势场分布的局部极大值点,求出势心就能确定初始聚类中心和聚类数目,而由于数据场的叠加性,势心通常没有和数据样本重合,所以应该求取距离势心最近的数据样本作为初始聚类中心,数学描述为:

式中:data(i,j)表示数据集中的任意数据点;d代表数据点与势心的距离;Fcenter为初始聚类中心。

3 仿真分析

为验证本文算法的的可行性和有效性,用MATLAB仿真表1中的多模雷达信号脉冲参数数据(用高斯随机变量模拟信号参数的测量误差),利用上述数据样本进行分选算法仿真实验。其中表1中雷达2、3为普通的频率捷变信号,雷达1与雷达4分别为具有3种工作模式的多模雷达信号。

表1 雷达仿真参数

图2 数据场算法生成的数据场等势线二维图

采用基于数据场多模雷达信号分选算法对雷达信号样本进行处理,首先进行数据预处理,然后计算信号样本的势值,绘制二维数据场等势图,如图2所示。选择载频和到达角等势线二维图来确定初始聚类中心值与聚类数目,从DOA与RF的二维等势线图中可以直观的看到雷达信号可分为4类,其它两个二维等势线图由于多模雷达信号的存在而不能正确的判断聚类数目。通过计算距这4个势心最近的样本数据可得到初始聚类中心,然后利用传统kmeans聚类算法对数据进行分选得到最终聚类中心,结果如表2所示。雷达信号分选脉冲数统计结果如表3所示。

从表2、表3可以看出,聚类中心的选择是正确的,而且本文算法针对存在多模雷达信号的辐射源电磁环境具有较高的分选准确率,分选正确率99.2%。

表2 初始聚类中心及最终聚类中心

为了比较基于数据场的聚类分选算法与传统k-means聚类分选算法处理多模雷达信号的分选效果[2]。由于传统k-means算法随机选择聚类数目和初始聚类中心,每次仿真会得到不同的聚类结果,因此这里在已知聚类数目为4,聚类中心随机选取的情况下,仿真50次取统计平均值,和本文算法分选结果比较如表4所示。

表3 数据场多模雷达信号分选脉冲统计结果

表4 分选算法对比

从上表数据可以看出,针对多模雷达信号,基于数据场聚类算法迭代次数减少,分选正确率得到提高,有效减少了由于初始聚类中心和聚类数目选择不合理而造成的多模雷达信号分选过程中“增批”现象的出现。

4 结 论

文中针传统聚类分选算法处理多模雷达信号容易出现“增批”现象的问题,将数据场引入到多模雷达信号分选中,通过绘制载频和到达角等势线二维图来确定多模雷达信号的初始聚类中心值与聚类数目。最后用传统k-means算法进行聚类。经过本文的仿真实验验证,本文提出的算法能能获取合适的初始聚类中心,确定聚类数目,对部分参数交叠的频率的频率捷变多模雷达有良好的分选效果,具有实际应用的价值。文中仿真实例证明了算法的有效性,但文中数据场势值运算复杂度较高,有待减少数据场势值的计算量。本文关于影响因子的选择是根据经验选择合适的影子因子,后续需要研究改进的影响因子的选择方法,从而能自动选择合适的影响因子。而且最终聚类结果中仍有部分雷达信号误分选,这是由于聚类算法类间分离能力较差的问题,所以后续需要增加对分选结果有效性评估体制,以进一步提高多模雷达信号分选准确性和可靠性。

猜你喜欢
等势线雷达聚类
线电荷的电力线和等势线的MATLAB 作图
基于Matlab模拟点电荷电场线和等势线
DLD-100C型雷达测试方法和应用
雷达
基于Matlab的静电场电场线和等势线(面)的数值模拟
基于DBSACN聚类算法的XML文档聚类
基于高斯混合聚类的阵列干涉SAR三维成像
基于Origin的一维电荷分布系统的静电场模拟
基于空时二维随机辐射场的弹载雷达前视成像
现代“千里眼”——雷达