一种基于隐马尔科夫模型的雷达辐射源识别算法

2015-01-08 13:46关一夫张国毅
火力与指挥控制 2015年10期
关键词:马尔科夫辐射源符号化

关一夫,张国毅

(空军航空大学,长春 130022)

一种基于隐马尔科夫模型的雷达辐射源识别算法

关一夫,张国毅

(空军航空大学,长春 130022)

针对现代雷达采用复杂的PRI样式不能对其进行准确识别的问题,提出一种基于隐马尔科夫模型的复杂体制雷达辐射源识别算法。该算法将具有复杂PRI样式辐射源识别问题转化为对具有分类特征的码序列的识别问题,通过运用符号动力学中符号时间序列分析(symbolic time series analysis)理论,将上述码序列识别问题建模为隐马尔科夫模型予以解决,实现了对具有PRI抖动、伪随机编码等复杂PRI调制样式雷达辐射源的准确识别。仿真结果证明算法在PRI值有部分重叠的情况下仍具有很好的识别能力。

雷达辐射源,识别,隐马尔科夫模型

0 引言

ESM(Electronic Support Measures)系统中的雷达辐射源识别模块根据被侦察辐射源的电磁特性识别其型号,得到与其相关的武器类型及搭载的平台信息,从而为战场的态势感知和威胁评估提供支持。现代复杂体制雷达一般具有多种工作模式,而且考虑到反侦察和抗干扰能力,各种工作模式的信号样式又是复杂多变的,其中PRI的变化样式尤为多样和复杂,如抖动、伪随机编码、多级参差、组变、滑变和排定等,这些复杂的变化样式再加上参数值存在部分重叠使识别结果出现模糊,给雷达辐射源的准确识别带来了很大困难[1-9]。

根据参数建模的方式不同,雷达辐射源识别方法主要分为两类[10]:一类是基于统计参数的识别方法,如神经网络的方法、灰度关联的方法、专家系统的方法、基于粗糙集理论的方法等[11-13];另一类是基于脉冲参数建模的识别方法,如联合分选识别方法[14]、雷达辐射源的序贯识别方法[15]、脉冲样本图的方法[16-17]等。第1类识别方法能够反映信号的整体变化特征和参数的统计特性,但却不能描述脉冲参数的时序变化规律;第2类中的上述识别方法虽然能够对脉间参数规律变化的信号进行准确描述,但是对PRI抖动、伪随机编码等没有周期变化规律或周期性不明显的信号样式则不能准确描述。此外,当参数值存在交叠时,上述方法的性能将受到很大影响。

隐马尔科夫模型自20世纪60年代末提出到现在,被广泛应用到语音识别、语言处理、机器视觉、图像处理和生物医学分析等各个领域,文献[18]将电子对抗中的辐射源识别、雷达工作模式转换序列识别、ELINT数据库建立分别建模为隐马尔科夫模型中的估计、解码和训练3类经典问题。

通过分析实际侦收的信号发现,对于PRI规律信号,其一个完整PRI序列中的PRI值变化规律符合一阶马尔科夫过程的约束关系;而对于抖动、伪随机编码等PRI变化样式,其变化具有隐马尔科夫模型的特性,例如,在分析信号时遇到的PRI四编码信号,这种信号只辐射4个PRI值,但是各个PRI值的出现顺序却看不出有任何规律。因为马尔科夫模型是隐马尔科夫模型的一种特例[19],因此,为了对各种PRI信号样式进行统一建模,本文提出一种基于隐马尔科夫模型的描述和识别方法,以解决对具有复杂PRI调制样式信号的雷达辐射源不能准确描述和识别的问题。该方法利用隐马尔科夫模型能够更充分地提取码序列时序变化规律的特点,实现了对PRI抖动、伪随机编码等复杂样式的准确识别,而且在PRI值存在部分重叠的情况下该算法仍具有较高的准确性。此外,该算法对于PRI固定、多级参差、组变等常规或规律变化样式也同样适用。

1 算法原理

本文算法主要分3部分:首先利用符号时间序列分析方法对脉冲序列的PRI进行符号化处理;然后用符号化处理之后的码序列对HMM进行训练;最后用训练好的HMM对符号化后的待识别序列进行识别。

1.1 符号化处理

在建立HMM实现雷达辐射源识别时需要解决的首要问题是如何对PRI序列进行变换得到统一的码序列,所谓统一的码序列是指码序列具有有限个码元,而且码序列从满足分类需求的角度说既要能保留PRI序列的变化规律信息又要能保留各个PRI具体数值的大小信息。语句识别中是通过建立统一的字符集和一系列语法规则来得到具有语义信息的字符序列的[19],考虑到PRI值变化的连续性,用建立字符集或建立码表的方式势必会造成字符数量过多或码表过于庞大的问题,因此,本文借鉴符号动力学(Symbolic Dynamics)中符号时间序列分析理论来对PRI序列进行符号化处理,从而得到能够反映PRI时序变化规律和PRI数值大小的符号序列。

符号化是将原始时间序列变换为一系列离散符号序列的过程。符号化是符号时间序列分析理论中的一种数据分析方法,多用于对复杂时变信号变化规律的提取及统计分析[20-21]。图1是一种比较简单的典型符号化过程:0-1二值化过程。符号化处理中需要解决的关键问题就是对数据进行划分,如图1中的二值化过程是将数据划分为两部分,虚线(本文称之为标尺)以上的标记为符号1,虚线以下的标记为符号0,这样划分虽然简单但是对于某些复杂的时域信号样式则很难反映其时序变化的规律,故而需要设置多个标尺来对数据进行更为复杂的划分,从而得到能够准确提取原始序列时序变化规律的符号序列。

得到符号序列只是符号化的第一步,为了方便对符号序列进行统计分析,还需要将符号序列进一步变换为码序列,获得码序列的过程如图1所示,这里取连续3个符号以二进制的方式形成一个码,故可以形成23种码字。

本文在对PRI序列进行符号化时采用类似的方法:用已知雷达库中的3个标尺对PRI序列进行划分得到相应符号序列,符号集为{0,1,2,3},考虑到待识别序列的长度可能较短,为了方便提取符号变化规律,取连续两个符号以四进制的方式形成一个码,故可以形成42种码字,码集为{0,1,…,15}。设已知雷达库中某一工作模式的3个标尺分别为PRImid,PRIdown和PRIup,3者满足式(1)~式(3)的关系。

其中PRIi(i=1,2,…,K)为已知雷达库某一雷达工作样式中包括的所有K个PRI值,对于抖动这种按PRI值范围存储的,PRImid,PRIdown和PRIup分别代表PRI中心值和PRI变化范围的上下限,det为预先设定的容差。

这种划分方法直观上好像破坏了原始序列的变化规律使其规律模糊化,但是其形成的符号序列以及码序列的变化规律则可以弥补这种模糊。此外可以想见,当用已知雷达数据库某部雷达的一个工作样式中的3个PRI标尺对待识别PRI序列进行划分时,对于属于该工作模式的待识别PRI序列,其形成的符号序列和码序列与不属于该工作模式的待识别PRI序列形成的符号序列和码序列会有很大的差异,这种差异即使在PRI值存在部分重叠的情况下仍能提供分类性很强的分类信息。

1.2HMM训练

由隐马尔科夫模型可以表示为一个五元组[22]的形式λ=(S,V,A,B,π),其中S是一组状态的集合,即S={s1,s2,…,sN};V是一组输出符号(也可称为观测符号)的集合,即V={v1,v2,…,vM};A是状态转移概率矩阵,A=(aij),aij=P(qt+1=j|qt=i),1≤i,j≤N表示在时刻t为状态si,而在时刻t+1转换为sj状态的概率;B为观测符号的概率分布,B={bj(k)},其中bj(k)=P(vk|sj),1≤k≤M,1≤j≤N表示在状态sj时观测符号为vk的概率;π为初始状态概率分布π= {πi},πi=P(q1=si),i=1,2,…,N,表示在时刻1选择某个状态的概率。

本文中取N=4,即有4种状态;M=42,即有16种观测符号。在确定了模型参数之后,下一步就是用属于一部雷达工作模式的码序列对HMM进行训练,本文采用Baum-Welch算法[22]进行训练,所谓训练,就是根据给定的观察序列O={O1,O2,…,OT},调整π,A和B,使得P(O|λ)最大,步骤如下:

其中rt为符号序列在t时刻出现的符号,R为符号集R={R1,R2,…,RI},本文中I=4,Ot为码序列在t时刻出现的码字,nij和ni分别表示符号序列中由符号Ri转换到Rj的次数和符号Ri出现的总次数,mjk和mj分别表示码序列和符号序列中在符号Rj观测到码vk的次数和符号Rj出现的总次数,T为观测序列的长度,δ(x,y)满足式(7)。

将初始化后的模型记为λc,c=0。

Step2 EM过程

E过程:由λ0根据式(8)和式(9),计算期望ξt(i,j)和γt(i)。

其中αt(i)和βt+1(j)分别称为前向变量和后向变量,定义式如式(10)和式(11)所示。

M过程:用E过程得到的期望值,根据式(12)~式(14)对πi,aij和bj(k)进行重新估计,从而得到。

Step3迭代

使c=c+1,重复EM过程,直至πi,aij和bj(k)值收敛。

需要注意的是,为了准确全面地描述某一工作模式PRI的变化规律,在训练的时候要考虑待识别序列可能存在不同的起始PRI值、脉冲丢失和噪声干扰等情况,因此,需要用大量样本序列进行训练,对于复杂的PRI变化样式,已知雷达数据库中需要同时存储多个训练好的模型对该工作模式的待识别序列进行准确识别。

1.3HMM识别

完成HMM训练之后,得到λl,l=1,2,…,L,其中L表示已知雷达数据库中各个雷达工作模式的总数,用这些训练完的模型对各个待识别序列进行识别,待识别序列为U条PRI序列用已知雷达数据库中各个工作模式的标尺进行划分得到的码序列。所谓识别就是给定观察序列(在这里为待识别码序列)O=(O1,O2,…,OT),以及模型 λl=(Sl,Vl,Al,Bl,πl),l=1,2,…,L,确定出使P(O|λ)最大并满足识别判决条件的序列作为成功识别的序列,识别的方法本文采用前向-后向算法(Forward-Backward Algorithm)[13],步骤如下:

Step1初始化

Step2递归

Step3终结

1.4 识别置信度与判决模型

在设用于训练某一雷达工作样式λl的各个样本序列长度为T,在训练完成之后,用式(15)~式(17)对这些训练样本进行识别,这样做的目的是为了得到参考识别概率Pl,设用于训练的样本序列条数为W条{Ow},w=1,2,…,W,则Pl如式(12)所示。

设有U条待识别码序列{Ou},u=1,2,…,U,则对于已知雷达数据库中的某一工作模式λl,识别概率Pul由式(19)可得:

则识别置信度模型如式(20)所示。

设定门限η后,识别判决模型如式(21)所示。

2 算法整体流程

下面将本文算法的整体流程总结如下:

Step1训练

用已知雷达库中属于某雷达工作模式的标尺对该工作模式训练样本序列进行符号化处理,得到样本码序列,用这些码序列根据式(4)~式(14)训练属于该工作模式的隐马尔科夫模型λl,l=1,2,…,L,并与根据式(18)算得的参考识别概率一并存入已知雷达数据库;

Step2识别

对U条待识别PRI序列用各已知雷达工作模式的标尺进行符号化处理,得到U×L条待识别码序列,根据式(15)~式(17)对这些待识别码序列进行识别;

Step3判决

根据式(19)~式(21)对识别结果进行判决,确定出待识别码序列与已知雷达数据库中各记录的对应关系。

需要注意的是,为了避免待识别序列长度对识别结果的影响,在识别的时候,需要先对待识别序列进行截取,使其长度等于训练样本序列的长度。

3 仿真分析

3.1 算法有效性仿真

下面设已知雷达数据库中有5部雷达的工作样式,其中工作模式2中每个子PRI值辐射40个脉冲。每批训练样本序列的长度均为200。仿真生成7批待识别PRI序列,其中有两批为未知雷达的序列,序列长度均为300,脉冲丢失率为2%,干扰脉冲5%,各数据库雷达的参数设置情况如下页表1所示。

图2 和图3所示为待识别序列与已知雷达数据库中的工作模式2匹配和不匹配的情况,其中不匹配序列的PRI样式为五参差,子PRI值分别为150 μs,156 μs,144 μs,184 μs和117 μs,图中虚线代表工作模式2在数据库中存储的3个标尺,不难看出,对于不匹配的待识别序列,其生成的码序列与匹配情况下生成的码序列有很大差异。在对各工作样式的HMM模型进行充分的训练之后,本文方法对上述5种已知样式均能准确识别,对于未知雷达序列也正确地判决为未知,多次仿真平均识别准确率在99%以上。

3.2 综合仿真

将已知雷达库中的工作模式数量增加到8个,除了表1中的5个又增加表2中的3种PRI抖动样式。这8种工作样式中有的样式的PRI值存在部分重叠,以验证算法对参数值重叠情况的强劲性。仿真生成10批待识别序列,其中有两批为未知雷达的数据,其他仿真条件同3.1。

仿真结果对上述8种工作样式的待识别序列均能正确识别,对于未知雷达序列也准确地判为未知,通过多次仿真,平均正确识别率在97%以上。此外,值得注意的是,对于中心值相同、抖动量不同的抖动样式已知雷达,只要合理设定det值,用本文的方法也能准确识别。

4 结束语

通过提取脉冲序列的脉间变化规律作为分类特征,从而实现雷达辐射源的识别具有重要的实际意义和理论价值[23],沿着这一思路,尝试将隐马尔科夫模型运用到雷达辐射源识别中,理论分析和仿真结果说明了这一方法的有效性。本文方法存在的问题主要是:由于HMM对待识别序列中PRI的出现顺序、脉冲丢失和干扰脉冲非常敏感,故需要对各种情况进行充分训练,才能弥补这种由于敏感造成的识别准确率下降问题。多数情况下一个雷达工作样式需要对应多个训练好的模型,当数据库中记录较多时这势必会造成需要匹配的次数骤增,但是这一问题随着并行计算的不断发展可以得到很好的解决。实际处理流程中,可以先利用载频和脉宽基于统计的方法与数据库粗关联,然后用本文的方法进一步精确识别。此外,综合利用PRI、载频和脉宽等参数,建立分类性更强的隐马尔科夫模型以用于识别是值得进一步研究的方向。

[1]Wiley R G.ELINT:The Interception and Analysis of Radar Signals[M].Norwood,MA:Artech House,2002.

[2]Siroris.Detection and Identification of Stable PRI Patterns Using Multiple Parallel Hypothesis Correlation Algorithms[P].US44269E,2013-06-04.

[3]Newham.SurveillanceSystemandMethod[P].US8111187B2,2012-02-07.

[4]Quan G R,Sun Y S,Chen B.Folding Deinterleaving Algorithm For Multiple Mixed Pulse Trains with Pulse Repetition Intervals[C]//Proceedings of the Fifth International Conference on Machine Learning and Cybernetics,2006: 3334-3338.

[5]Drake.Method and System for De-interleaving Signals[P]. US8102297B2,2012-01-24.

[6]Song.Method and Device for Recognizing PRI Modulation Type of Radar Signal[P].US8531330B2,2013-09-10.

[7]Guillaume.Fast Learning of Gramma Production Probabilities in Radar Electronic Support[J].IEEE Transaction on Aerospace and Electronic Systems,2011,46 (3): 1262-1287.

[8]Keshavarzi.A New Method for Detection of Complex Pulse Repetition Interval Modulations[C]//IEEE 11th Internationa Conference on Year,2012,4(3):1705-1709.

[9]Manish G.Electronic Warfare:Issues and Challenges for Emitter Classification[J].Defence Science Journal,2011,6(3):228-234.

[10]刘海军,柳征,姜文利,等.基于联合参数建模的雷达辐射源识别方法[J].宇航学报,2011,32(1):142-149.

[11]Ashraf M A.A Soft-Decision Fusion Approach for Multiple-Sensor Distributed Binary Detection Systems[J].IEEE Transactions on Aerospace and Electronic Systems,2011: 2208-2216.

[12]Aziz A M.A New Nearest-Neighbor Association Approach Based on Fuzzy Clustering[J].Aerospace Science and Technology,2012,37(4):1-10.

[13]Ashraf M.Aziz.A Novel and Efficient Approach for Automatic Classification of Radar Emitter Signals[C]//IEEE Aerospace Conference,2013(4):1-8.

[14]Hassan H E.A New Algorithm for Radar Emitter Recognition[C]//Proceedings of the 3rd International Symposium on Image and Signal Processing and Analysis,Ontario,2003.

[15]杨博,许丹,黄知涛,等.雷达辐射源的序贯识别方法[J].宇航学报,2008,29(3):1022-1024.

[16]Gong L L,Wu S L.A Radar Emitter Identification Method Based on Pulse Match Template Sequence[C]//2010 2nd International Conference on Signal Processing Systems,IEEE,2010.

[17]Chen T,Guo W,Shen B.A New Radar Emitter Recognition Method Based on Pulse Sample Figure[C]//2011 Eighth International Conference on Fuzzy Systems and Knowledge Discovery,2011:1902-1905.

[18]Lavoie.Hidden Markov Modeling for Radar Electronic Warfare[P].US6788243B2,2004-09-07.

[19]Rabiner R.A Tutorial on Hidden Markov Models and Selected Applications in Speech Recognition[J].IEEE,1989,77(2):257-286.

[20]Daw C S.Symbol Statistics:A New Tool for Understanding Multiphase Flow Phenomena[R].Oak Ridge National Laboratory,2011:12-15.

[21]Song K H.Pulse Repetition Interval Modulation Recognition Using Symbolization[J].IEEE,2010,6(3):33-37.

[22]Alpaydin E.Introduction to Machine Learning[M].Norwood,MA:Artech House,2009.

[23]Method C.System and Program Product for De-interleaving and Classifying Arbitrary Radar Pulse Patterns Using Non-Deterministic Finite State Automata [P]. US8587468B2,2013-11-19.

A Radar Emitter Recognition Algorithm Based on Hidden Markov Models

GUAN Yi-fu,ZHANG Guo-yi
(Aviation University of Air Force,Changchun 130022,China)

Aiming at the problem that modern radars use complex PRI modulation types which make them can’t be accurately recognized,this article puts forward a recognition method for radar emitters with complex PRI modulation types based on Hidden Markov Models.The method issues transforms the problem foregoing into a problem of recognition for specific code sequences with classification characteristics,modeling it as Hidden Markov Models by employing symbolic time series analysis theory of symbolic dynamics,and realizing the accurate recognition for emitters with such complex PRI modulation types as PRI jitter,pseudo random coded,etc.Simulation results demonstrate that the method issued possesses good recognition capability even when PRI values of different emitters exist partial overlap.

radar emitter,recognition,hidden markov models

TN971

A

1002-0640(2015)10-0098-06

2014-07-15

2014-10-17

关一夫(1988- ),男,黑龙江哈尔滨人,硕士研究生。研究方向:雷达信号分选,合批处理和雷达辐射源识别。

猜你喜欢
马尔科夫辐射源符号化
基于三维马尔科夫模型的5G物联网数据传输协议研究
小学数学教学中渗透“符号化”思想的实践研究
基于叠加马尔科夫链的边坡位移预测研究
基于博弈论的GRA-TOPSIS辐射源威胁评估方法
基于改进的灰色-马尔科夫模型在风机沉降中的应用
数字电视外辐射源雷达多旋翼无人机微多普勒效应实验研究
外辐射源雷达直升机旋翼参数估计方法
马尔科夫链在企业沙盘模拟教学质量评价中的应用
马尔科夫链在企业沙盘模拟教学质量评价中的应用
关于一阶逻辑命题符号化的思考