基于多任务复数因子分析模型的雷达高分辨距离像识别方法

2015-10-14 04:03徐丹蕾刘宏伟
电子与信息学报 2015年10期
关键词:样本数训练样本个数

和 华 杜 兰 徐丹蕾 刘宏伟



基于多任务复数因子分析模型的雷达高分辨距离像识别方法

和 华 杜 兰*徐丹蕾 刘宏伟

(西安电子科技大学雷达信号处理国家重点实验室 西安 710071)

传统的高分辨距离像(HRRP)统计识别方法大部分只使用雷达目标高分辨回波的幅值信息且需要大量的训练样本保证统计模型参数学习的精度。为了充分利用高分辨回波的相位信息,在雷达采样率有限、训练样本数不足的条件下保证统计识别的性能,该文提出一种多任务学习(MTL)复数因子分析(CFA)模型,将数据描述推广到复数域,将每个方位帧训练样本的统计建模视为单一的学习任务,各学习任务共享加载矩阵,利用贝塔伯努利(Beta-Bernoulli)稀疏先验自适应地选择各任务需要的因子,完成多任务的共同学习。基于实测数据的识别实验显示,与传统的单任务学习(STL)因子分析模型相比,该文提出的多任务因子分析模型具有更低的模型复杂度且在小样本条件下可以显著提高识别性能。

雷达自动目标识别;高分辨距离像;多任务学习;因子分析

1 引言

高分辨距离像(HRRP)是宽带雷达目标散射点子回波沿雷达视线方向投影的叠加,它反映了目标散射体的散射截面积沿雷达视线方向的分布情况,包含了目标的尺寸大小和散射点分布等丰富的结构信息。作为雷达目标的一种重要的特征,高分辨距离像易于获取和处理,已经成为雷达目标识别领域的研究热点。在雷达目标识别中,充分利用训练样本的信息,构建合适复杂度的模型描述数据对于提高识别性能相当关键。

根据散射点模型理论,高分辨回波是由同一距离单元的多个散射点子回波相关叠加而成,包含幅度和相位。目前大多数关于距离像识别的文献都是对实距离像进行统计建模和识别[6,7],忽略了相位信息。文献[7]假设实距离像服从高斯分布,但取模后的雷达回波幅值与高斯分布显然是失配的。文献[8]将高分辨回波的距离单元分为两种类型,采用与高分辨回波更加匹配的Gamma, Gaussian Mixture双分布模型,提高了识别性能。文献[7]利用因子分析(FA)模型描述实距离单元的相关性,进一步提升了实距离像的识别性能。文献[9]的实验表明,复距离像的相位信息有助于改善识别性能,不过该文献提取的特征并不适合于统计建模。为了充分利用高分辨回波的相位信息,可以考虑对复距离像建模。相比于实距离像,直接对复距离像建模的主要问题在于其初相敏感性。文献[10]分析证明了在复高斯假设条件下初相的存在并不影响复距离像的统计特性。文献[11]采用复数因子分析(CFA)对复距离像建模,提高了识别性能,但该方法中因子个数需要提前设定,因子个数过大会产生过匹配,因子个数过小则难以较好地描述数据。

由于高分辨距离像的方位敏感性,一般需要按照一定角域(不发生越距离单元走动)对距离像进行分帧,对于宽带雷达,目标不发生越距离单元的角度较小,每类目标分帧后的帧数较多,对每一帧分别独立建模,模型复杂度和运算量相对较大,而同一目标各帧的距离像具有一定的相似性,多帧模型的学习也即多个学习任务之间具有很强的相关性。根据多任务学习[12](MTL)的思想,不同方位帧的学习任务可以共享某些模型参数,通过减少待学习模型参数的个数,降低对训练样本数的需求,因此在相同训练样本数条件下,多任务学习可以提高模型参数的估计精度。文献[13]采用多任务隐马尔可夫模型对实距离像的谱图建模,在训练样本较小时仍能获得较好的识别性能。

本文将文献[11]的方法推广到多任务学习,采用多任务复数因子分析(MTL-CFA)模型对复距离像建模,在不同方位帧共享FA模型中的加载矩阵,并利用贝塔伯努利(Beta-Bernoulli)稀疏先验自适应地选择各方位帧需要的因子,解决了文献[11]中因子个数的选择问题,在利用不同学习任务相关性的同时,充分利用了高分辨回波的相位信息,进一步提高了识别性能。基于实测数据的识别实验验证了提出方法的有效性。

2 基于MTL-CFA的高分辨距离像的统计建模

在介绍MTL-CFA模型之前,先简单介绍一下传统的FA模型。

2.1传统的FA模型与因子个数选择

FA模型主要用于描述分布于低维线性子空间的高维数据。高维数据的每个样本可以表示为多个相互独立的因子与噪声的线性组合:

为了能够充分利用相位信息,文献[11]采用复数因子分析在复数域对高分辨回波建模。假设目标有类,每一类目标的距离像样本按角域均匀分帧,第类分为帧,,一般认为复距离像的均值为零,将式(1)中的均值项去掉,然后将因子和噪声的分布从实高斯推广到复高斯得到CFA模型:

2.2基于MTL-CFA模型的高分辨距离像的统计建模

下面将CFA模型推广到多任务学习,介绍基于MTL-CFA模型的高分辨距离像的统计建模。

一般假设复距离像中的噪声为复高斯白噪声,服从零均值,各维相互独立的复高斯分布:

与CFA相比,基于MTL-CFA模型的复距离像建模既共享了加载矩阵,利用了不同方位帧之间的相关性,又利用Beta-Bernoulli稀疏先验,自动选择每一帧的因子个数,其贝叶斯图模型如图1所示。

图1 MTL-CFA的贝叶斯图模型

按照贝叶斯理论[16],隐变量和参数的后验分布的推断方法主要有基于马尔可夫蒙特卡罗(MCMC)的吉布斯(Gibbs)采样方法[16]和变分近似[16]两种,考虑到计算精度和收敛速度,本文采用变分近似推断隐变量和参数的后验分布,下面介绍基于变分贝叶斯(VB)的后验分布的求解过程。

2.3基于变分近似的隐变量后验分布推断

根据变分贝叶斯理论,完全数据由观测数据和隐变量构成,隐变量和参数的分布通过最大边缘似然准则[14]求解。在MTL-CFA模型中,各目标各方位帧的所有的训练样本组成观测数据,隐变量与参数合起来记为,参数先验分布中的超参数记为。若记隐变量和参数的联合概率密度函数为,那么观测数据的对数边缘似然可以表示为

一般来说,隐变量和参数之间具有一定的依赖关系,其联合分布的推导比较复杂,若假设其相互独立,则根据变分贝叶斯理论[16],每个隐变量或参数的分布正比于全数据的联合似然函数关于其他参数与隐变量的数学期望。变分贝叶斯推断就是更新隐变量和参数的分布,使得下界不断增大的过程,的更新步骤如下:

3 基于MTL-CFA的高分辨距离像的统计识别

本文采用统计识别方法,根据最大后验准则的贝叶斯分类器判定测试样本的类别。首先将训练样本分帧,然后采用MTL-CFA得到各帧样本的概率密度函数,根据贝叶斯公式,测试样本属于第类第帧的后验概率正比于先验分布和帧概率密度函数的乘积:

于是,帧概率密度函数可表示为

4 实验结果和讨论

4.1数据及实验设置介绍

为了验证本文提出的的模型的识别性能,我们采用同文献[17]等相同的3类飞机的实测数据,雷达和飞机目标的详细参数如表1和表2所示。3类飞机目标的航迹在地面的投影见图2所示,雷达位于坐标(0,0)处。每类目标数据分成多段,在本实验中,雅克-42的第2,5段,奖状飞机的第6,7段,安-26飞机的第5,6段样本用于训练,估计帧概率密度函数,其余段样本用于测试,验证模型的识别性能。

为了克服姿态敏感性,采用同文献[17]一致的做法对训练样本按角域均匀分帧,奖状和安-26各50帧,雅克-42有35帧,每帧含有1024个样本,每个样本有256个距离单元,即,,,,;同样,为了克服强度敏感性,对每个训练样本和测试样本采用L2范数归一化。经过上述预处理之后,数据就可以用于模型的训练和识别实验的测试。

表1实验雷达参数

信号类型Chirp信号 中心频率(MHz)5520 带宽(MHz)400 脉冲重复频率(Hz)400 Dechirp后采样频率(MHz)10

表2 飞机参数

飞机类别机长(m)翼展(m)机高(m) 安-2623.8029.209.83 奖状14.4015.904.57 雅克-4236.3834.889.83

图2 3类目标飞行航迹

4.2模型选择性能分析

图3 3类目标的后验分布图

4.3 相关模型比较

下面我们将从模型复杂度、识别性能等两个方面比较本文提出的MTL-CFA与STL-CFA[11]及2.1节提到的STL-RFA[8]的优劣,为了比较的公平性,STL-CFA与STL-RFA中的因子个数均经过BIC模型选择确定。

4.3.1模型复杂度比较 一般来说,模型参数越多,复杂度越高,所需的训练样本就越多,各模型用于3类飞机数据的实参数个数见表3。

图4给出各个模型的总实参数个数随样本数的变化图。由于MTL-CFA学习过程中是多帧模型同时学习,对内存的需求量较大,本文在8核i7-2.80 GHz处理器,32 G内存的移动工作站上进行实验,当每帧样本个数大于130时,对内存的需求大于32G,所以本文中MTL-CFA的实验只做到每帧130个样本。从图中可以看出,各模型估计的参数个数随着样本数的增加呈上升趋势,这是由于文献[8,11]采用BIC自动选择因子个数,MTL-CFA也通过稀疏先验自动确定因子个数,各模型能够选择适合数据样本个数的复杂度。另外可以看出在不同样本数下,MTL-CFA需要估计的参数个数明显少于STL- RFA和STL-CFA,其中,STL-CFA需要估计的参数最多,因此其复杂度最高。

表3不同模型中实参数个数

方法参数个数 STL-RFA,表示第类第帧的因子个数 STL-CFA MTL-CFA ,表示共享因子个数,表示第类的帧数

图4 总参数随样本数的变化图

4.3.2识别性能比较 由于不同模型在不同样本数下模型参数个数不同,其识别性能也有差异。各模型识别率随样本数的变化如图5所示。与4.3.1节复杂度比较实验类似,由于内存的限制,MTL-CFA的识别实验也只做到每帧130个样本。从图5可以看出,各个模型下的识别率均随着样本数的增加在上升。当每帧样本数在70~130之间时,MTL-CFA的识别率明显高于STL-RFA 和STL-CFA, STL- CFA的识别率最低。若以识别率高于0.85为基准确定样本个数,MTL-CFA只需要70个样本,而STL- RFA和STL-CFA需要约160和240个样本,约为MTL-CFA所需样本数的2倍和3倍。因此,在相同识别性能时,MTL-CFA所需的样本数更少,更适合于小样本问题。随着样本数增多,STL-CFA和STL-RFA的识别性能趋于稳定。当每帧样本数等于或大于512时,STL-CFA的识别性能优于STL-RFA,说明复距离像的相位信息有助于改善识别性能。图5中MTL-CFA每帧130个样本时的平均识别率是93.78%, STL-CFA每帧1024个样本时的平均识别率是93.22%, STL-RFA每帧1024个样本时的平均识别率是91.49%,因此MTL-CFA的识别性能是最优的。

图5 识别率随样本数的变化曲线

5 结论

本文提出了一种基于MTL-CFA模型,在多类目标帧概率密度函数学习过程中,利用不同子任务之间的相关性,共享加载矩阵,各帧自动选择合适复杂度的因子个数。该模型不仅减小了统计模型复杂度和对训练样本数需求,而且充分利用了复距离像的相位信息。基于实测数据的识别实验表明,在样本较少的情况下MTL-CFA可以获得更好的识别性能,适用于小样本统计识别问题。

[1] 张瑞, 牛威寇鹏. 基于样本紧密度的雷达高分辨距离像识别方法研究[J]. 电子与信息学报, 2014, 36(3): 529-536.

Zhang Rui, Niu Wei, and Kou Peng.Radar high resolution range profiles recognition based on the affinity[J].&, 2014, 36(3): 529-536.

[2] 张学峰, 王鹏辉, 冯博, 等. 基于多分类器融合的雷达高分辨距离像目标识别与拒判新方法[J]. 自动化学报, 2014, 40(2): 348-356.

Zhang Xue-feng, Wang Peng-hui, Feng Bo,..A new method to improve radar HRRP recognition and outlier rejection performances based on classifier combination[J]., 2014, 40(2): 348-356.

[3] 张玉玺, 王晓丹, 姚旭, 等. 基于复数全极化HRRP的雷达目标识别[J]. 系统工程与电子技术, 2014, 36(2): 260-265.

Zhang Yu-xi, Wang Xiao-dan, Yao Xu,.. Radar target recognition based on complex fully polarimeric HRRP[J]., 2014, 36(2): 260-265.

[4] 潘勉, 王鹏辉, 杜兰, 等. 基于 TSB-HMM 模型的雷达高分辨距离像目标识别方法[J]. 电子与信息学报, 2013, 35(7): 1547-1554.

Pan Mian, Wang Peng-hui, Du Lan,.. Radar HRRP target recognition based on truncated stick-breaking hidden markov model[J],&, 2013, 35(7): 1547-1554.

[5] 姚莉娜, 吴艳敏, 崔光照. 基于随机森林的雷达高分辨距离像目标识别新方法[J]. 郑州大学学报(工学版), 2014, 35(4): 105-108.

Yao Li-na, Wu Yan-min, and Cui Guang-zhao. New method of radar high resolution range image target recognition based on random forest[J].(), 2014, 35(4): 105-108.

[6] Jacobs S P and O’Sullivan J A. Automatic target recognition using sequences of high resolution radar range profiles[J]., 2000, 36(2): 364-380.

[7] Du L, Liu H, and Bao Z. Radar HRRP statistical recognition: parametric model and model selection[J]., 2008, 56(5): 1931-1944.

[8] Du L, Liu H, and Bao Z. A two-distribution compounded statistical model for radar HRRP target recognition[J]., 2006, 54(6): 2226-2238.

[9] Du L, Liu H, and Bao Z. A novel feature vector using complex HRRP for radar target recognition[J]., 2007, 4491: 1303-1309.

[10] 王鹏辉, 杜兰, 刘宏伟. 基于复高斯模型的雷达高分辨距离像目标识别新方法[J]. 光学学报, 2014, 34(2): 275-284.

Wang Peng-hui, Du Lan, and Liu Hong-wei. A new method based on complex Gaussian models for radar high resolution range profile target recognition[J]., 2014, 34(2): 275-284.

[11] 王鹏辉. 基于统计建模的雷达高分辨距离像目标识别方法研究[D]. [博士论文], 西安电子科技大学, 2012.

Wang Peng-hui. Study of radar high resolution range profile target recognition based on statistical modeling[D]. [Ph.D dissertation], Xidian University, 2012.

[12] Xue Y, Liao X, and Carin L. Multi-task learning for classification with Dirichlet process priors[J]., 2007, 8: 35-63.

[13] Pan M, Du L, and Wang P. Multi-task hidden Markov modeling of spectrogram feature from radar high-resolution range profiles[J]., 2012(1): 1-17.

[14] Watanabe S. A widely applicable Bayesian information criterion[J]., 2013, 14(1): 867-897.

[15] Paisley J and Carin L. Nonparametric factor analysis with beta process priors[C]. Proceedings of the 26th ACM Annual International Conference on Machine Learning, 2009: 777-784.

[16] Ando T. Bayesian Model Selection and Statistical Modeling [M]. CRC Press, 2010, 43-96.

[17] Du L, Liu H, and Wang P. Noise robust radar HRRP target recognition based on multitask factor analysis with small training data size[J]., 2012, 60(7): 3546-3559.

Radar HRRP Target Recognition Method Based on Multi-task Learning and Complex Factor Analysis

He Hua Du Lan Xu Dan-lei Liu Hong-wei

,,’710071,)

Most traditional recognition methods for High Resolution Range Profile (HRRP) only utilize the amplitude information and need large number of training samples to obtain better estimation precision of model parameters. To utilize the phase information contained in the complex echoes and obtain better recognition performance with small training data and low sampling rate, a statistical model based on Multi-Task Leaning (MTL) and Complex Factor Analysis (CFA), referred to as MTL-CFA, is proposed in this paper. The MTL-CFA model directly describes the complex HRRP data. The statistical modeling of each training aspect-frame is considered as a single task, and all tasks share a common loading matrix. The factor number of each task is automatically determined via the Beta-Bernoulli sparse prior. Experimental results based on measured data show that the proposed model MTL-CFA can not only describe the observed data with lower order of model complexity, but also obtain satisfactory recognition accuracy with small training data, compared with the traditional Single- Task Learning (STL) based on FA models.

Radar Automatic Target Recognition (RATR); High Resolution Range Profile (HRRP); Multi-Task Learning (MTL); Factor Analysis (FA)

TN958

A

1009-5896(2015)10-2307-07

10.11999/JEIT141591

2014-12-11;改回日期:2015-06-29;

2015-07-17

杜兰 dulan@mail.xidian.edu.cn

国家自然科学基金(61271024, 61201296, 61322103),高等学校博士学科点专项科研基金(20130203110013)和陕西省自然科学基础研究计划(2015JZ016)

The National Natural Science Foundation of China (61271024, 61201296, 61322103); The Foundation for Doctoral Supervisor of China (20130203110013); The Natural Science Foundation of Shaanxi Province (2015JZ016)

和 华: 男,1988年生,博士生,研究方向为雷达目标识别.

杜 兰: 女,1980年生,教授,博士生导师,研究方向为统计信号处理、雷达信号处理、机器学习及其在雷达目标检测与识别方面的应用.

刘宏伟: 男,1971年生,教授,博士生导师,研究方向为雷达信号处理、MIMO雷达、雷达目标识别、自适应信号处理、认知雷达等.

猜你喜欢
样本数训练样本个数
境外蔗区(缅甸佤邦勐波县)土壤理化状况分析与评价
勘 误 声 明
怎样数出小正方体的个数
人工智能
等腰三角形个数探索
怎样数出小木块的个数
怎样数出小正方体的个数
宽带光谱成像系统最优训练样本选择方法研究
融合原始样本和虚拟样本的人脸识别算法
基于稀疏重构的机载雷达训练样本挑选方法