基于Gammatone频率倒谱系数的舰船辐射噪声分析

2021-03-10 07:59吴晏辰王英民
水下无人系统学报 2021年1期
关键词:识别率舰船特征提取

吴晏辰, 王英民

基于Gammatone频率倒谱系数的舰船辐射噪声分析

吴晏辰, 王英民

(西北工业大学 航海学院, 陕西 西安, 710072)

舰船辐射噪声的声学特征提取对目标训练和识别有着重要影响。文中提出一种基于Gammatone频率倒谱系数(GFCC)的特征分析方法: 以目标特征提取方法——Mel频率倒谱系数(MFCC)算法作为比照组, 针对小型低速船只、小型高速船只及大型船只三大类目标, 在2种不同水声环境中提取的5122个样本进行了分类识别比对试验。试验结果表明, 2种算法的目标识别率均大于80%, 且GFCC在海洋复杂声环境中的识别率显著高于MFCC, 并对高频目标更敏感。说明GFCC算法与标准的MFCC算法相比, 在海洋等强干扰环境下具有更好的抗噪性和更高的快速目标识别率。

水下目标识别; 舰船辐射噪声; 特征提取; Gammatone频率倒谱系数; Mel频率倒谱系数

0 引言

水下目标识别是水声工程领域的一个重要分支。按照信号生成方式划分, 水下目标识别通常被分为被动目标辐射噪声识别和主动目标回波识别[1]。与主动声呐相比, 被动声呐具有隐蔽性强的优点。由于辐射噪声的组成主要由舰船机械噪声、螺旋桨噪声和水动力噪声组成, 因此可以借由分析舰船辐射噪声, 利用声源的固有属性来识别噪声。但是, 由于水声目标复杂的发声机理、水下复杂的声信道环境等诸多因素, 基于被动声呐的舰船辐射噪声识别技术一直是声呐领域中的研究重点与难点[2]。

随着神经网络的不断发展, 人工智能在水下目标识别中的应用越来越多。作为目标识别主要组成部分之一的特征提取, 不但对传统目标识别结果起着关键作用, 也显著影响着神经网络在水下目标识别系统中的准确性[3]。文中利用文献检索平台, 以“水下目标识别(underwater acoustic ta- rget recognition, UATR)”为关键词, 统计了2015~ 2020年所有公开发表的中英文文献, 并将所有文献关键词制作成词云[4], 如图1所示。比对2014~ 2018年的数据表明, 自2018年以来, 国内学者由多数采用支持向量机(support vector machine, SVM)转向对神经网络的深入发掘, 且大部分文献的研究方向是以特征提取为基础的, 其中较常见的是利用模拟人耳听觉效应, 获得诸如听音感知特征和声学参数特征等[5], 如梅尔频率倒谱系数(Mel frequency cepstrum coefficient, MFCC)。

图1 文献关键词词云

作为目标应用最广泛的特征, MFCC在针对无干扰环境下的目标识别中具有很好的应用效果, 但随着环境噪声提高, 识别效果急剧下降。而Gammatone滤波器组可以通过模拟人耳的频谱分析与频率选择特性, 获得很强的抗噪性, 在强干扰环境下也能保持较好的识别效果[6-8]。基于此, 文中提出基于Gammatone频率倒谱系数(Ga- mmatone frequency cepstrum coefficient, GFCC)的目标特征提取分析方法, 利用GFCC代替MFCC, 使用K近邻(K-nearest neighbor, KNN) 算法作为分类器, 提取目标的40阶GFCC特征, 并以同一目标的40阶MFCC特征作为对照组, 对小型低速船只、小型高速船只及大型船只三类目标在低噪声的水库样本及高噪声的近海样本进行分类[9]。结果表明, GFCC特征较MFCC特征在高噪声环境下具有更好的抗干扰能力。

1 舰船辐射噪声特征提取

1.1 MFCC特征提取

由于辐射噪声的时变特性, 需要对信号作短时分析[10], 因此需要利用分帧来提取信号的帧特征参数, 同时, 为了保证每一帧之间的信号连续性, 利用帧移使每帧互有交叠, 并在最后将若干帧合并组成样本的特征向量。每帧长度取30 ms, 帧移50%帧间长度。

利用快速傅里叶变换(fast Fourier transform, FFT)对帧信号进行处理, 得到信号能量谱

式(4)~式(6)共同构成帧特征向量

图2为MFCC特征提取的主要流程。

图2 MFCC特征提取流程

1.2 GFCC特征提取

式中,为信号采样点数。

由于Gammatone滤波器组具有无限长单位脉冲响应特性, 因此Gammatone滤波系数

从水声信号中提取特征时, 将人耳听觉特征的临界值作为每个滤波器的带宽, 可表示为

将式(8)~(9)联立取对数得信号的Gammatone能量谱

利用DCT, 得到Gammatone系数

求式(13)的最大值、最小值、中值、平均值及标准差等5种统计参数, 可得GFCC特征向量。 GFCC特征提取的主要流程图见图3。

2 舰船辐射噪声样本采集

表1给出了目标在水库和近海试验所得的舰船辐射噪声音频信息。将样本分为3类: 甲种小型低速船只、乙种小型高速船只以及大型船只。所有样本均由西北工业大学航海学院声学工程与检测技术国家专业实验室收集制作, 图4为水库试验照片。

表1 舰船辐射噪声样本信息

3 分类识别和特征分析

文中采用KNN算法[11]作为样本分类器, 具体步骤如下: 1) 将样本目标得分初始化为0, 对训练用样本与未知样本间的距离进行计算; 2) 对所有计算所得样本进行排序, 得到个最小距离; 3) 统计所有样本, 对距离训练样本小于最小距离的待测样本所在的类别分值加1; 4) 统计每类目标得分, 将得分最大类作为未知样本类。

图4 水库试验现场照片

将采集的样本目标分别采用MFCC特征和GFCC特征进行训练, 并使用KNN进行目标分类, 分类结果见表2和表3。

表2 MFCC特征提取后样本识别统计结果

表3 GFCC特征提取后样本识别统计结果

对于水库测试的样本, 无论使用MFCC或是GFCC, 识别率都达到了较高的水平, 但是对于海洋测试样本, 其识别率产生了一定的差距, 图5给出了3类目标40阶MFCC (蓝色)与GFCC(红色)特征值均值比较, 试验结果表明: 1) 复杂声环境对于基于特征提取的水下目标识别系统具有显著影响; 2) 与MFCC特征提取相比, 在复杂声环境下, GFCC特征提取可有效提高水下目标识别系统的识别能力, 其抗噪能力更好; 3) 对于海洋样本测得的3类船只, MFCC幅值普遍低于GFCC幅值。

图5 海洋舰船辐射噪声样本目标MFCC与GFCC特征值比较

可以看到, 随着滤波器阶数的提高, 在3类船只目标1~40阶范围内, GFCC都显示出明显的优势。由于民用船只通常是高速航行状态, 其高频辐射噪声中有很大一部分由螺旋桨的空化噪声组成, GFCC在高频区域对于快速船只的幅值收敛速度明显小于MFCC, 因此更适合用来排查小型舰艇。

4 结束语

文中分别采集了3类舰船目标在低噪声水库中和复杂海洋环境下的辐射噪声, 结合对大数据平台关于水下目标识别的中英文文献的数据分析, 分别采用MFCC和GFCC 2种方法对目标进行了特征提取, 再利用KNN对采集的3类舰船辐射噪声进行了分类识别与比较。结果表明: 在水下复杂声场环境中, GFCC较MFCC具有更优良的抗噪能力, 对快速目标的识别能力也更强。后续, 将利用卷积神经网络替代KNN进行更加深入的研究。

[1] 徐及, 黄兆琼, 李琛, 等.深度学习在水下目标被动识别中的应用进展[J].信号处理, 2019, 35(9): 1460-1475.

Xu Ji, Huang Zhao-qiong, Li Chen, et al. Advances in Underwater Target Passive Recognition Using Deep Learning[J]. Journal of Signal Processing, 2019, 35(9): 1460-1475.

[2] 方世良, 杜栓平, 罗昕炜, 等. 水声目标特征分析与识别技术[J]. 中国科学院院刊, 2019, 34(3): 297-305.

Fang Shi-liang, Du Shuan-ping, Luo Xin-wei, et al. Development of Underwater Acoustic Target Feature Analysis and Recognition Technology[J]. Bulletin of the Chinese Academy of Sciences, 2019, 34(3): 297-305.

[3] 杜雪, 廖泓舟, 张勋. 基于深度卷积特征的水下目标智能识别方法[J]. 水下无人系统学报, 2019, 27(3): 260-265.

Du Xue, Liao Hong-zhou, Zhang Xun. Underwater Target Recognition Method Based on Deep Convolution Feature[J]. Journal of Unmanned Undersea Systems, 2019, 27(3): 260- 265.

[5] 程锦盛, 杜选民, 周胜增, 等. 基于目标MFCC特征的监督学习方法在被动声呐目标识别中的应用研究[J]. 舰船科学技术, 2018, 40(9): 116-121.

Cheng Jin-sheng, Du Xuan-min, Zhou Sheng-zeng, et al. Application of the MFCC Feature Based Supervised Le- arning Method in Passive Sonar Target Recognition[J]. Ship Science and Technology, 2018, 40(9): 116-121.

[6] 吴姚振, 杨益新, 田丰, 等.基于Gammatone频率离散小波系数的水下目标鲁棒识别[J].西北工业大学学报, 2014, 32(6): 906-911.

Wu Yao-zhen, Yang Yi-xin, Tian Feng, et al. Robust Underwater Target Recognition Based on Gammatone Frequency Discrete Wavelet Coefficients(GFDWC)[J]. Journal of Northwestern Polytechnical University, 2014, 32(6): 906-911.

[7] 周萍, 沈昊, 郑凯鹏.基于MFCC与GFCC混合特征参数的说话人识别[J]. 应用科学学报, 2019, 37(1): 24-32.

Zhou Ping, Shen Hao, Zheng Kai-peng. Speaker Recognition Based on Combination of MFCC and GFCC Feature Parameters[J]. Journal of Applied Sciences, 2019, 37(1): 24-32.

[8] 刘雨柔, 张雪英, 陈桂军, 等. VMD改进GFCC的情感语音特征提取[J]. 计算机工程与设计, 2020, 41(8): 2265-2270.

Liu Yu-rou, Zhang Xue-ying, Chen Gui-jun, et al. Feature Extraction of Emotional Speech Based on Improved GFCC with VMD[J]. Computer Engineering and Design, 2020, 41(8): 2265-2270.

[9] Jiang J, Shi T, Huang M, et al. Multi-Scale Spectral Feature Extraction for Underwater Acoustic Target Recognition[J]. Measurement, 2020, 166: 108227.

[10] 张少康, 田德艳. 水下声目标的梅尔倒谱系数智能分类方法[J]. 应用声学, 2019, 38(2): 267-272.

Zhang Shao-kang, Tian De-yan. Intelligent Classification Method of Mel Frequency Cepstrum Coefficient for Underwater Acoustic Targets[J]. Applied Acoustics, 2019, 38(2): 267-272.

[11] 曾向阳. 水下智能目标识别[M]. 北京: 国防工业出版社, 2016: 8-15.

Ship-Radiated Noise Analysis Based on the Gammatone Frequency Cepstrum Coefficient

WU Yan-chen, WANG Ying-min

(School of Marine Science and Technology, Northwestern Polytechnical University, Xi’ an 710072, China)

Acoustic feature extraction of ship-radiated noise has a major effect on target training and recognition. This research proposes a feature analysis method based on the gammatone frequency cepstrum coefficient(GFCC). The method uses the typical target feature extraction method——Mel frequency cepstrum coefficient(MFCC) algorithm for comparison and uses 5 122 samples with three types of targets, namely, small low-speed, small high-speed, and large vessels. The samples are extracted in two different underwater acoustic environments to generate a classification identification comparison test. Results show that the recognition rate of the two algorithms is greater than 80%. However, the recognition rate of GFCC in an ocean complex acoustic environment is found to be significantly higher than that of MFCC and is more sensitive to high-frequency targets. These results show that the GFCC algorithm has better noise resistance and a higher recognition rate for fast targets in oceanic and other strong interference environments as compared with the standard MFCC algorithm.

underwater target identification; ship-radiated noise; feature extraction; gammatone frequency cepstrum coefficient(GFCC); Mel frequency cepstrum coefficient

TJ630.34; TB53

A

2096-3920(2021)01-0060-05

10.11993/j.issn.2096-3920.2021.01.009

吴晏辰, 王英民. 基于Gammatone频率倒谱系数的舰船辐射噪声分析[J]. 水下无人系统学报, 2021, 29(1): 60-64.

2020-10-15;

2020-11-30.

吴晏辰(1989-), 男, 在读博士, 主要研究方向为神经网络和水下声信号.

(责任编辑: 杨力军)

猜你喜欢
识别率舰船特征提取
同步定位与建图特征提取和匹配算法研究
支持向量机的舰船图像识别与分类技术
风浪干扰条件下舰船航向保持非线性控制系统
舰船测风传感器安装位置数值仿真
基于MED—MOMEDA的风电齿轮箱复合故障特征提取研究
基于曲率局部二值模式的深度图像手势特征提取
档案数字化过程中OCR技术的应用分析
基于PCA与MLP感知器的人脸图像辨识技术
科技文档中数学表达式的结构分析与识别
人工智能现状和发展