基于波形结构特征和支持向量机的水面目标识别

2015-12-13 11:46孟庆昕杨士莪于盛齐
电子与信息学报 2015年9期
关键词:零点分类器波长

孟庆昕 杨士莪 于盛齐

1 引言

通常情况下,舰船辐射噪声主要由机械噪声和螺旋桨噪声组成。哪一种作为决定因素取决于目标船的工况。不同类别的目标从动力系统到机械结构,再到工作状态都存在显著区别。同一类的目标辐射信号总是表现一定程度的相似性,而不同类别目标信号则表现差异性,这为识别不同类别的水声信号奠定了基础[1]。借鉴语音声学的研究成果,音色可作为区分不同目标的依据。由于时域波形结构特征隐含了音色信息[2],所以可用来区分不同类别的水面目标信号。

近年来,机器学习算法是数据分析领域的一个研究热点,而支持向量机(SVM)效果颇丰。文献[3]应用 SVM 对稀疏表示的水声目标特征集进行识别,大幅度提高目标识别速度;文献[4]将水平集获取的特征矢量输入SVM识别图像声呐信号;文献[5]提出一种基于核层面信息融合的雷达辐射源个体识别框架;文献[6]建立多维分形和 SVM 的模型,提高了智能地雷对地面装甲目标的识别准确率。在生物医学工程领域,SVM用于肢体肌电信号的特征提取与分类[7]。构建SVM分类器,参数优化选取是关键。常用参数寻优算法包括:网格搜索法,遗传算法(Genetic Algorithm, GA)[8],以及粒子群算法(Particle Swarm Optimization, PSO)[9,10]等。网格搜索法原理简单,通过遍历网格搜索全局最优解,但可操作性差。GA和PSO算法不必遍历搜索参数,即可获得全局最优解,但容易陷入局部最优解,因此需要在常规的方法基础上加以改进。

2 原理和方法

2.1 波形结构

波形结构特征提取应用了搜寻极值、过零点以及统计分布等方法,极大地压缩了数据,反映了模式的本质特征。

波形结构主要包含4个方面特征:过零点波长,峰峰幅度,过零点波长差分以及波列面积。统计样本序列的过零点波长数,用 S ( αi) 表示过零点波长为αi的个数。则过零点波长为αi的概率分布函数为

H = m ax(Ak)代表样本序列的最大峰峰幅度。所有的峰峰幅度值被H归一化,并在取值范围内的20个均分区间统计分布。用 βi(i = 1 ,2,… ,2 0) 表示任意区间, S ( βi)代表落在区间 βi的峰峰幅度值的个数,则峰峰幅度的概率分布函数为

θi表示任意相邻两个波长差,S ( θi)计算过零点波长点差为θi的数目,则过零点波长差的概率分布函数为

波列面积是由水平轴和时域波形围成的图形面积,可以用一系列长方形来近似表示。设波列面积的最大值为 S =max ( Rk),将归一化之后的波列面积区间均分为20等份,ξi(i= 1,2,… ,20)表示任意区间。设落在ξi区间的波列面积数目为S( ξi),则波列面积的概率分布函数为

根据以上时域波形结构的4种统计特性,构建一个9维的波形特征矢量,包含如下:

(1)平均过零点波长的概率密度;

(2)过零点波长分布概率最大值;

(3)过零点波长分布概率最大值对应的波长值;

(4)过零点波长差分分布概率最大值对应的差分值;

(5)归一化波列面积为0到p1的概率和;

(6)峰峰幅度概率值在 0到 q1的所有值的概率和;

(7)峰峰幅度概率值在 q1到 q2的所有值的概率和;

(8)峰峰幅度概率值在 q2到 q3的所有值的概率和;

(9)归一化峰峰幅度值在 0 到 p1范围内的所有值的概率和。

其中 0<p1<1, 0<q1<q2<q3<1。

过零点波长分布反映信号的频率高低,峰峰幅度分布反映信号幅度的起伏程度,过零点波长差的分布反映信号的频率变化快慢,波列面积分布综合反映信号频率和幅度起伏信息。音色是声信号时频变化的综合体现。波形结构特征描述了隐含的音色信息,符合人耳感知的听觉特征。

2.2 支持向量机

支持向量机(SVM)是参数识别和分类领域一种很有效的研究方法。其基本观点为将信号从样本空间转化到特征空间,确定优化超平面(边界)函数,使得两类目标信号之间距离最大化[11]。如图1所示,分类间隔是超平面到两类目标数据最近点的距离,该点即支持向量的距离[12]。也就是说,SVM分类器的目标是在高维特征空间获得最优分离超平面[13]。

SVM 分类器的核函数有很多种,包括线性函数,多项式核函数,sigmoid 核函数以及径向基函数(RBF)等。本文设置的核函数为 RBF 核函数(K( x, y)=e-γx-y2, γ >0)。RBF核将样本信号以非线性方式转换到高维特征空间。经证实,RBF核函数和其他的线性核函数表现出类似的性能,同时RBF核的参数较多项式核函数更少,从而降低了模型的复杂度。

2.3 交叉验证法

SVM 模型的泛化能力通常用经典的交叉验证法评价。k折交叉验证法的原理是将数据分成k个子集。每次用其中的一个子集作为测试集,而其他k- 1个子集作为训练集。先用训练集中的数据训练分类器模型,再用得到的 SVM 分类器对测试集的数据进行测试。每个数据点都会出现在测试集1次,出现在训练集k -1次。随着k的增加,结果估计的均方值会随之减小。将k次交叉验证的预测准确率平均值作为衡量模型推广能力的标准。交叉验证法避免了过学习和欠学习的问题。

图1 SVM的基本原理图

2.4 参数选取方法

2.4.1 网格搜索法 基于RBF核的SVM的性能主要受惩罚因子C和核参数γ的影响。核函数主要反映样本数据在高维空间的复杂程度,即维数[13]。而惩罚因子通过调节特征空间中置信范围和经验风险的比例,使SVM的泛化能力达到最好。SVM的性能优化转化为参数对(C , γ )的优化选择问题。

对于参数搜索,目前尚未有公认的最有效方法。网格搜索法由于原理简单,是搜索 SVM 一种常用方法。该方法的过程如下:首先,根据经验,确定参数γ和C的搜索范围;其次,恰当选取搜索步长,得到一系列的参数对(C , γ );然后,每一组参数对被用来训练 SVM 模型;最后,挑选使训练序列的预测精度达到最大的SVM参数对(C, γ),即得到泛化能力强的 SVM 分类器。换言之,网格搜索方法是应用海量搜索获得最优解的。比如,若γ和C参数的候选值分别为m和n,则对(C , γ )的2维参数空间被划分为m×n个网格。该种方法理论上,在参数搜索范围足够大、搜索步长足够小的情况下是可以得到全局最优解的。但是搜索时间较长,且由于采取逐步逼近的方法,花费在非最优解区域的时间过长,是不可忽视的。

2.4.2 优化算法 在对参数对(C, γ)进行选择时,优化算法是必不可少的。常用的优化算法包括遗传算法、差分进化算法(Differential Evolution, DE)以及粒子群优化(PSO)算法等。DE算法具有较强的全局收敛能力和鲁棒性,可以避免遗传算法的早熟缺点。然而,DE算法随着迭代次数的增加,优化效率逐渐降低,迭代后的个体收敛程度差,可能出现发散的结果[14]。粒子群算法具有收敛速度快的特点,迭代后群体中的粒子收敛(或集中)程度非常高,每个粒子搜索到的最优位置在计算和显示精度内基本上处于同一点,粒子会很快地失去种群多样性,容易陷入局部最优[15]。

本文采用一种基于DE算法和PSO算法的混合优化算法 DEPSO。该算法使群体能够保持一定的多样性,既不像PSO算法那样所有粒子很快收敛于同一位置,也不像DE算法那么发散,而是所有个体逐渐趋向于同一点,并保有多样性的潜能。同时还可以进一步根据收敛程度对最终的最优解进行取舍,即将迭代后收敛程度相对不高情况下的最优解舍弃。

在对群体进行初始化时,每个个体根据搜索范围随机产生:

DEPSO算法首先按照DE算法进行搜索,然后将DE算法得到的最后一代群体作为PSO算法粒子的初始位置和每个粒子搜索到的局部最优位置的初始值,迭代后所有代中的最优个体作为PSO算法所有粒子迄今为止搜索到的全局最优位置的初始值。其中,DE算法中所有代的最优个体的获取方法如同PSO算法对全局最优位置的更新方式一样,每迭代一次后都通过目标函数值的比较进行保留或更新。PSO算法中粒子的初始速度同样根据搜索范围随机产生,根据Clerc的速度更新公式[16],可表示为

并且,在搜索过程中对于移动到搜索空间外的个体,对其位置进行随机分配,当>X时,d dmax

这样整个DEPSO算法实际上是在DE算法搜索到的全局最优附近,采用PSO算法进行局部的精确搜索,并进一步提高群体的收敛程度。

3 实验与分析

3.1 波形结构

对比分析两类水面目标信号结构特征参数。分别提取两类目标信号的过零点波长、峰峰幅度、过零点波长差分以及波列面积,统计其结果,绘制概率密度函数曲线。目标辐射噪声的数据十分宝贵,尤其是水下目标信号。但由于条件所限,目前尚缺少多目标,不同工况下的目标辐射噪声数据。

如图2至图5所示,两类目标信号从过零点波长特征、归一化的峰峰幅度特征、过零点波长差分以及归一化的波列面积等特征进行对比,发现针对同一特征两类目标信号特征值的取值范围和极值大小均存在明显差异。根据图2至图5的4个特征,提取9维特征值,构成特征矢量,输入到SVM分类器。为了简便,以下分别以目标1和目标2代指商船和水面运输机。

3.2 支持向量机

对目标信号截取的每一时域波形提取9维波形结构特征。则输入SVM分类器的样本共有240组,其中120组来自目标1,其它的120组来自目标2。输入的240组样本被分割为两部分,其中一部分作为训练样本,训练分类器获得最优 SVM 参数,另一部分作为测试样本,作为估算分类精度的依据。测试样本和训练样本各自所占的比例影响了分类精度,在下一节作详细的讨论。

3.3 分类结果

应用SVM分类器对目标1和目标2进行分类实验,核函数为 RBF。核宽度参数γ和惩罚因子C需适当选取,才能获得最佳的分类性能。本文分别应用常用的网格搜索方法和DEPSO法搜索参数对(C,γ)。 调用MATLAB 工具箱LIBSVM验证了最优参数下的SVM分类器的性能。

从4个方面提取数据的时域波形结构特征,构建9维特征矢量,240组特征矢量作为SVM分类器的输入量。每一组时域波形的长度为0.5 s,采样频率为10 kHz。惩罚因子C 的搜索范围为 [2-5210],核宽度参数 g 的搜索范围为 [2-1026]。C 和γ的搜索步长均为0.5。应用5-折交叉验证法验证SVM分类器的性能,则分类结果如图6所示。

图2 归一化的过零点波长分布曲线

图3 归一化的峰峰幅度分布曲线

图4 归一化的过零点波长差分分布曲线

图5 归一化波列面积分布曲线

图6 网格法搜索最优参数

网格搜索最优参数结果如图6所示。横轴代表惩罚因子,纵轴代表核函数宽度,均以对数坐标表示。图中所给出的是平均识别准确率的等高线图。如图6所示,参数C和参数 γ只覆盖了图中网格的部分区域,这说明参数只在特定区域取值。同时,最优参数对不能直接从图上选取最大识别率对应点读出,因为过大的惩罚因子可能会造成训练样本的过学习现象。也就是说,在分类准确率同为最高的条件下,惩罚因子C 更小的参数对是优化解。

DEPSO法搜索最优参数的结果如图7所示。x轴代表惩罚因子,y轴代表核函数宽度,均以对数坐标表示。z轴代表目标函数,即测试数据的分类识别精度。根据优化算法DEPSO的特点,由收敛程度对最终的最优解进行取舍,即将迭代后收敛程度相对不高情况下的最优解舍弃,此时最优解的精度往往较低。反复进行50次参数搜索实验,选取其中散点个数较少、一致收敛的结果作为全局最优解。由图6和图7的对比可知,由于优化算法实际是在全局最优解附近搜索,故目标函数值(除极少的散点)都维持在较高的取值,避免了网格搜索法在不关心区域的盲目搜索问题。

根据表1中的分类结果,SVM分类器的性能受测试数据比例的影响。当训练序列数目较小时 (占输入数据的50.0%, 第3行),两类目标的分类平均准确率(测试数据)为67.5%。当训练序列数目增加到输入数据的75.0%时,平均识别精度增加到 88.3%。当训练序列数目增加到87.5%时,平均识别精度仅增加到90%。结果表明提高训练样本数目可以帮助得到更高的分类精度,这从统计意义上很好理解。但是过大的训练样本数却是不符合实际情况的。

图7 DEPSO法搜索最优参数

在某些情况下,需要两次搜索获得最优参数对。由于缺少先验知识,首先在较大的区间范围,以较大的步长,获得一个全局最优参数。然后在获得的最优参数对附近,以更小的步长,第2次搜索最优参数对。表2和表3是一个二次搜索获取二分类实验最优参数对的算例。训练样本占实验数据总数75%。第1次搜索,搜索步长为0.5 ,得到一组全局最优参数对(C1,1γ)。第2次搜索,仅在区间[C1/4,4 C1]和[1γ/4,41γ]组成的网格搜索最优参数,搜索步长为0.1。结果表明,第1次搜索的初始区间对最终的分类结果有很大的影响,这带有一定的经验成分。第2次搜索在第1次寻得的最优参数附近,减小了搜索步长,获得了更精细的结果。理论上,搜索范围足够大、搜索步长足够小的情况下,该方法可以获得全局最优参数,但可操作性差。

表 1 网格搜索法分类结果

表2 第1次搜索结果

表3 第2次搜索结果

如表4所示,应用优化算法DEPSO寻得最优参数对(C,γ)构建SVM分类器,对测试数据进行分类识别实验。与表1中实验相同的输入数据,在训练样本占实验数据总数分别为87.5%, 75.0%, 66.7%和 50.0%的情况下,应用优化算法后得到的分类精度依次为100%, 88.33%, 86.25%和72.5%,比网格搜索方法整体有了较显著的提高。同时,由于DEPSO避免了遍历搜索,搜索范围的设置对结果的影响大大降低。DEPSO方法更加切实有效,其优势是十分明显的。值得一提的是,两次搜索法涵盖了 [2-10210]和 [2-10210]组成的网格。由于在 C<2-6, γ>27的情况下无法寻得有效结果,在本部分讨论中将该部分网格舍弃。故表2、表3和表4的结果具有可比性。

4 结束语

本文对水面目标时域波形结构特征提取方法进行了研究。在4种信号统计特性(过零点波长特征,峰峰幅度特征,过零点波长差分以及波列面积特征)的基础上,构建了9维的特征矢量。将特征矢量输入 SVM 分类器对水面目标信号进行分类识别。该特征提取方法符合人的主观感受,具有实际意义。提出了差分进化粒子群混合算法(DEPSO),通过对惩罚因子和核函数宽度参数的优化选取,达到了优化系统 SVM 模型的目的,并将结果与网格搜索法进行比较。改进优化方法 DEPSO 搜索参数融合DE算法和PSO算法的优点,避免了网格搜索法的盲目搜索,更切实有效,具有寻优速度快、精度高、收敛效果好等特点。在缺少先验知识的情况下,获得了更高的识别率。

海试数据验证了以上分类识别方法的有效性。值得一提的是,表中所列的结果是两个目标多组信号的统计平均结果,具有典型意义。目标辐射噪声的数据十分宝贵,尤其是水下目标信号。但由于条件所限,目前尚缺少多目标、不同工况下的目标辐射噪声数据。故仅在此作为一种可试行的水面和水下目标识别方法探究,拟于今后进一步丰富实验检验。

表 4 DEPSO法分类结果

[1] 王志伟. 水下目标被动识别技术方法研究[D]. [硕士论文],哈尔滨工程大学, 2002.Wang Zhi-wei. The recognition study of passivity target[D].[Master dissertation], Harbin Engineering University, 2002.

[2] 蔡悦斌, 张明之, 史习智, 等. 舰船噪声波形结构特征提取及分类研究[J]. 电子学报, 1999, 27(6): 129-130.Cai Yue-bin, Zhang Ming-zhi, Shi Xi-zhi, et al.. The feature extraction and classification of ocean acoustic signals based on wave structure[J]. Acta Electronica Sinica, 1999, 27(6):129-130.

[3] 廖明熙, 张小蓟, 张歆. 基于稀疏表示的水声信号分类识别[J]. 探测与控制学报, 2014, 36(4): 67-70.Liao Ming-xi, Zhang Xiao-ji, and Zhang Xin. Classification and recognition of underwater acoustic signal based on sparse representation[J].Journal of Detection & Control, 2014, 36(4):67-70.

[4] 许文海, 续元君, 董丽丽, 等. 基于水平集和支持向量机的图像声呐目标识别[J]. 仪器仪表学报, 2012, 33(1): 49-55.Xu Wen-hai, Xu Yuan-jun, Dong Li-li, et al.. Level-set and SVM based target recognition of image sonar[J].Chinese Journal of Scientific Instrument, 2012, 33(1): 49-55.

[5] 史亚, 姬红兵, 朱明哲, 等. 多核融合框架下的雷达辐射源个体识别[J]. 电子与信息学报, 2014, 36(10): 2484-2490.Shi Ya, Ji Hong-bing, Zhu Ming-zhe, et al.. Specific radar emitter identification in multiple kernel fusion framework[J].Journal of Electronics & Information Technology, 2014,36(10): 2484-2490.

[6] 丁凯, 方向, 张卫平, 等. 基于声信号多重分形和支持向量机的目标识别研究[J]. 兵工学报, 2012, 33(12): 1521-1526.Ding Kai, Fang Xiang, Zhang Wei-ping, et al.. Target identification of acoustic signals based on multi-fractal analysis and support vector machine[J]. Acta Armamentarii,2012, 33(12): 1521-1526.

[7] 张启忠, 席旭刚, 罗志增. 基于非线性特征的表面肌电信号模式识别方法[J]. 电子与信息学报, 2013, 35(9): 2054-2058.Zhang Qi-zhong, Xi Xu-gang, and Luo Zhi-zeng. A pattern recognition method for surface electromyography based on nonlinear features[J]. Journal of Electronics & Information Technology, 2013, 35(9): 2054-2058.

[8] Chen Ping-wei, Wang Yung-ying, and Lee Ming-hahn. Model selection of SVMs using GA approach[C]. Proceedings of 2004 IEEE International Joint Conference on Neural Networks,Pscataway, NJ, 2004: 2035-2040.

[9] 周绍磊, 廖剑, 史贤俊. RBF-SVM 的核参数选择方法及其在故障诊断中的应用[J]. 电子测量与仪器学报, 2014, 28(3):240-246.Zhou Shao-lei, Liao Jian, and Shi Xian-jun. Kernel parameter selection of RBM-SVM and its application in fault diagnosis[J]. Journal of Electronic Measurement and Instrumentation,2014, 28(3): 240-246.

[10] 郑适, 张安学, 岳思橙, 等. 基于改进粒子群优化的探地雷达波形反演算法[J]. 电子与信息学报, 2014, 36(11): 2717-2722.Zheng Shi, Zhang An-xue, Yue Si-cheng, et al.. Ground penetrating radar inversion algorithm based on improved particle swarm optimization[J]. Journal of Electronics &Information Technology, 2014, 36(11): 2717-2722.

[11] Fernandez P J A, Baeten V, Renier A M, et al.. Combination of support vector machines (SVM) and near-infrared (NIR)imaging spectroscopy for the detection of meat and bone meal(MBM) in compound feeds[J]. Journal of Chemometrics,2004(18): 341-349.

[12] Cristianini N and Taylor J S. An Introduction to Support Vector Machines and Other Kernel-based Learning Methods[M]. Cambridge: The Press Syndicate of the University of Cambridge, 2001: 93-94.

[13] 廖晓晰. 动力系统的稳定性理论和应用[M]. 北京:国防工业出版社, 2000: 169-199.Liao Xiao-xi. Stability Theory and Application of Power System[M]. Beijing: National Defence Industry Press, 2000:169-199.

[14] 杨坤德. 水声阵列信号的匹配场处理[M]. 西安: 西北工业大学出版社, 2008: 32-39.Yang Kun-de. Matched Field Processing of Underwater Acoustic Array Signals[M]. Xi’an: Press of Northwestern Polytechnical University, 2008: 32-39.

[15] 纪震,廖惠连,吴青华. 粒子群算法及应用[M]. 北京: 科学出版社,2009: 169-199.Ji Zhen, Liao Hui-lian, and Wu Qing-hua. Application of Particle Swarm Algorithm[M]. Beijing: Science Press, 2009:169-199.

[16] Clerc M. The swarm and the queen: towards a deterministic and adaptive particle swarm optimization[C]. Proceedings of the Congress of Evolutionary Computation. Washington,USA, 1999: 1951-1957.

猜你喜欢
零点分类器波长
2019年高考全国卷Ⅱ文科数学第21题的五种解法
一类Hamiltonian系统的Abelian积分的零点
基于实例的强分类器快速集成方法
加权空-谱与最近邻分类器相结合的高光谱图像分类
结合模糊(C+P)均值聚类和SP-V-支持向量机的TSK分类器
日本研发出可完全覆盖可见光波长的LED光源
RP—HPLC波长切换法同时测定坤泰胶囊中6个成分的含量
便携式多用途光波波长测量仪
基于LLE降维和BP_Adaboost分类器的GIS局部放电模式识别
适用于波长交换光网络的波长旋转图模型设计