一种基于改进EMD分解人车地震动信号识别算法

2022-05-10 06:29邹瑛珂贾云飞刘素芸
中国测试 2022年4期
关键词:希尔伯特包络线信噪比

邹瑛珂, 贾云飞, 刘素芸

(1. 南京理工大学机械工程学院,江苏 南京 210094; 2. 山西北方兴安化学工业有限公司,山西 太原 030008)

0 引 言

近年来,随着安全形势的变化以及传感器技术的不断成熟,自动化预警、“无人值守”概念在安保领域和军事领域越来越受重视。作为周界安防系统的一环,对地面目标的识别需求最为广泛;因此,如何从传感器所采集到的含噪音地面地震动信号中提取需要的信息来实现对人车目标的识别就显得尤为重要。其中,研究在复杂振动信号中提取有用的特征值的方法对解决地震动信号人车识别问题具有重要意义。针对此问题所开展的研究相对较少,目前比较主流的传统方法是以短时过零点[1]、峭度[2]、小波变换、经验模态分解为代表的方法;在国内,针对人车信号的专门研究比较少,类似问题的前沿方法包括由陶良小等提出的基于线性阵列包络线偏移叠加的检测方法[3],吴甄非等提出的HHT变换[4]来帮助识别人车信号。在国外,针对类似震动信号,Muralidharan等也提出了一种基于随机森林和变分模态分解的震动信号特征提取方法[5]。刘自然提出一种基于改进经验小波变换的冲击信号特征提取方法[6]。这些方法在平坦且震动传导良好的水泥路面、实验室环境中表现出色。但在野外环境中,由于土质、天气、地下生物活动等因素影响,地震动信号常常包含着许多噪音,且往往需要探测较远距离的目标,这些因素造成整个信号信噪比偏低,且后两者计算量偏大,不易进行实际应用。因此上述方法虽然在实验环境表现出色,但在野外松软土质环境中识别率较低。基于环境和被测信号的特征两个因素,本文使用希尔伯特变换提取包络线来实现一次降噪,并将一次降噪后的信号利用改进型的EMD分解方法来获得具有高信噪比的IMF分量,然后通过互相关函数、统计学量等方法获得特征值,最后投入随机森林分类器中进行分类从而实现较远距离人车信号的识别。

1 算法原理

1.1 希尔伯特变换

希尔伯特变换是一种常用的提取信号包络线的方法。该变换方法可以看做是一个正交滤波器,可将所有的正频率分量移相–90°,对负频率分量移相90°,从而能将一个实信号变换为一个复信号的虚部。通过求解该复信号的幅值即可求得原信号的包络从而将其低频分量解调出来[7]。

一个实信号x(t)的希尔伯特变换定义为:

将原信号作为实部,式(1)信号作为虚部,可得到一个解析复信号:

得到该复信号后,通过求其幅值则可得到其复包络信号:

1.2 经验模态分解

经验模态分解方法(EMD)是依据数据自身的时间尺度特征来进行信号分解而无须预先设定任何基函数。正是这样的特性,使EMD 方法在理论上可以应用于任何类型的信号的分解, 因而在处理非平稳及非线性数据上,具有非常明显的优势和很高的信噪比。

EMD分解步骤可归类为如下几步[8]:

1)找出原始信号所有极值点。

4)原始信号减均值包络线,得到中间信号:

5)判断该中间信号是否满足IMF的两个条件:

①在整个数据段内,极值点的个数和过零点的个数必须相等或相差最多不能超过一个。

②在任意时刻,由局部极大值点形成的上包络线和由局部极小值点形成的下包络线的平均值为零,即上、下包络线相对于时间轴局部对称。

如果满足,该信号就是一个IMF分量IMFi(n),用原始信号减去该IMF,作为新的原始信号,返回第一步。

重复步骤1)~5)k次,直到满足IMF筛选停止的原则。IMF筛选停止原则为:

EMD分解的优点是克服了基函数无自适应性的问题,对于一段信号可以不进行事先的复杂分析或参数调整就可直接分解出所需的特征信号,且运算量相对小波分析等算法来说更较小,这是其可运用在下位机上的关键优势。但其算法本身的原理会导致其分解出来的IMF出现模态混叠现象甚至造成信号失真;并且在低信噪比的信号中分解出来的IMF信噪比也会较低,导致这种现象会被进一步放大,从而影响后续识别的结果。虽然有人也提出了包括EEMD[9]等改进方法,但针对此类问题的效果提升不大。因此需要对EMD分解进行改进。

1.3 协方差叠加经验模态分解

针对低信噪比信号的EMD分解方法,本文提出了一种名为协方差叠加经验模态分解(covariance superposition empirical mode decomposition, CSEMD)的改进型EMD方法。其基本原理是对信号中具有高相关性的信号进行加重,低相关性的信号(一般为噪音)进行减重。在此基础上进行EMD分解,从而得到拥有较高信噪比的IMF分量。CSEMD分解可归类为如下几步:

1)对信号x(n)进行EMD分解。

2)将EMD分解所得出的IMF信号IMFi(n)与原始信号x(n)进行协方差运算。所得到的协方差矩阵为:

3)将所得协方差标准化后进行排序,取协方差最大的IMF信号为IMFmax(n),取协方差最小的IMF信号为IMFmin(n)。二者相减并取其平均值,将值加至原始信号得到高信噪比信号x'(n)。其公式为:

4)对x'(n)再次进行EMD分解,可得高信噪比IMF。

1.4 随机森林算法

随机森林算法是机器学习、计算机视觉等领域内应用较为广泛的一个分类器,也可以作为一种数据降维的手段[10]。通过集成学习的思想,将原本作为弱分类器的通过不同训练集训练出来多个决策树算法集成到一起从而形成一个强分类器,实现复杂的分类。

随机森林在变量(列)的使用和数据(行)的使用上进行随机化,生成很多分类树,每个树都是一个独立的判断分支,互相之间彼此独立。其中生成分类树的算法本文中采用基尼指数[11]:

当在基于某属性对一个新的对象进行分类判别时,随机森林中的每一棵树都会给出自己的分类选择,并由此进行加权输出。本算法相比其他机器算法优点是不易过拟合,不用进行相关参数的调整,其算法理解起来较容易,可以很好地移植到下位机上进行独立运算,且判断过程的运算量较低,不用运算复杂的矩阵。

2 信号仿真实验

下文将通过人员和车辆两种仿真信号各自使用希尔伯特变换+CSEMD与希尔伯特变换+EMD算法进行分解,并将所得的特征信号在信噪比和模态混叠现象方面进行对比。

2.1 人员仿真信号生成

根据特点分析,可以将人员信号看作是一种类冲击信号,其特征是不连续出现但是信号本身频率较高。由于在野外环境下人员信号会受到土壤中某些高频振动信号(如风吹树导致树根震动、地下动物的活动)的干扰,因此在信号中会有能量较高的高频震动信号和幅值较低的随机信号。根据分析生成如下信号,长度为1024个数据点,采样频率为1000 Hz。其中人员仿真信号方程为:

式中:N——数据点位置;

f——需要提取的特征信号;

rand——绝对值介于0到0.25的高斯白噪音。

其中,260

图1 人员仿真信号

2.2 人员仿真信号实验

利用希尔伯特变换提取的包络线如图2所示。

图2 人员仿真信号包络线

可以看出包络线虽然提取出了冲击信号,但由于毛刺过多会严重影响后续算法的准确性。直接使用CSEMD提取人员脚步特征结果如图3所示。

图3 包络线CSEMD分解结果IMF3

通过IMF3模态可以看出虽然CSEMD可以提取出脚步信号,但其信噪比较低,且有比较严重的模态混叠现象,不利于后续包括均值、方差、峭度等特征量的提取。因此必须对包络线进行平滑处理。由于人行走信号是一种类冲击信号,幅值较大。因此进行的平滑处理不可以过滤该类信号。同时观察到包络线中的毛刺主要是围绕某个值所产生的上下小范围跳变,是高频低幅值噪音,使用滑动平均滤波效果好。考虑到二者性质,使用滑动平均滤波可使信号平滑的同时保留冲击信号特征[12]。其滤波公式为:

其中n为帧长。此处步长取1。

通过滑动平均滤波平滑处理后的包络线信号如图4所示。

图4 人员仿真信号包络线(平滑后)

可以看出在保留了冲击信号的同时过滤掉了绝大多数的毛刺信号,便于后续的算法分解。使用EMD和CSEMD提取人员脚步特征结果如图5和图6所示。

图5 平滑后包络线EMD分解结果

图6 平滑后包络线CSEMD分解结果IMF3

对比图3,可以看出对平滑后的包络线进行分解后获得的脚步信号信噪比更高,更有利于对包括翘度、方差等特征量提取。但其中EMD分解提取出的第一个脚步信号有所失真。只有平滑后的包络线通过CSEMD分解提取出的脚步信号在保证信号不失真的同时拥有更高信噪比,模态混叠现象影响较小,更有利于从中提取特征量从而完成识别。

2.3 车辆仿真信号生成

根据特点分析,车辆信号可以看做是一种连续低频信号。且由于技术指标要求车辆探测距离较远,因此幅值较低。在野外环境下会受到土壤中某些高频振动信号(如风吹树导致树根震动、地下动物的活动)的干扰,因此在信号中会有能量较高的高频震动信号和幅值较低的随机信号。生成信号如图7所示,长度为 900个数据点,采样频率为 1000 Hz。由于车辆震动信号也与人行走震动信号一样是自身产生的震动信号与地面中的高频信号的叠加。因此车辆仿真信号方程为:

图7 车辆仿真信号

2.4 车辆仿真信号实验

参照人员信号,对其进行希尔伯特变换,所得包络线如图8所示。

图8 车辆仿真信号包络线

直接使用CSEMD从中提取车辆脚步特征结果如图9和图10所示。

图9 车辆仿真信号包络线CSEMD分解结果IMF3

图10 包络线CSEMD分解结果IMF3瞬时频率

可以观察到由于大量毛刺的影响,使用CSEMD进行信号分解有比较严重的模态混叠。由于车辆信号属于一种低频信号,进行滑动平均滤波处理对车辆信号的影响较小。因此同样使用滑动平均滤波,所得图像如图11所示。

图11 车辆仿真信号包络线(平滑后)

使用EMD和CSEMD对平滑后的包络线提取车辆特征结果如图12和图13所示。

图12 车辆仿真信号平滑后包络线EMD分解结果IMF3

图13 车辆仿真信号平滑后包络线CSEMD分解结果IMF3

由于在时域上二者的对比不是很明显,因此观察二者的瞬时频率结果如图14和图15所示。

图14 平滑后包络线EMD分解结果IMF3瞬时频率

图15 平滑后包络线CSEMD分解结果IMF3瞬时频率

从瞬时频率图中与图10相比可以看出,通过CSEMD提取出的车辆信号的IMF3模态可改善模态混叠。虽然对连续车辆信号的提取改善相较于EMD没有脚步信号明显,但对其进行特征提取仍然是有利的。

综上所述,本文提出的希尔伯特+CSEMD算法对人员脚步信号的提取相对于传统希尔伯特+EMD算法在提高信噪比、防止提取信号失真和抑制模态混叠方面有明显正面促进作用。在针对连续车辆信号方面也有一定改善。因此本算法对于提取人车信号是有效的。

3 实际信号实验与结果分析

3.1 人员与车辆信号样本说明

在晴天、低速风(风速不高于3级)、均质土壤的环境中通过采集卡和VAS-100地震动传感器获得人车原始信号,采集频率为 1000 Hz。地震动传感器插入地表以下约20 cm处,测试车辆为某品牌SUV在距离传感器100 m以20 km/h匀速向着传感器方向行驶,测试人员为单人从距离传感器50 m处向着传感器方向正常匀速行走。车辆和人员的部分原始信号如图16和图17所示。

图16 车辆原始信号

图17 人员原始信号

由于信噪比较低,进行傅里叶变换后其简单的时域特征量(包括平均数,中位数,方差,最大最小值等)和频谱功率谱的各个特征量(包括平均数,中位数,方差,最大最小值等)都较为相近,因此无法单纯从频域上进行识别。而运用一些较为复杂的频域特征提取算法如小波变换等计算量又过大,无法在下位机中实现。因此需要在时域或时频域上寻找其他计算量相对较小又能够提取其特征的方式来实现目标功能。

3.2 实际信号实验

处理数据为上述实地采集的车辆人员地震动数据,其中车辆数据为距离传感器100 m处开始向着传感器方向接近的过程,人员数据为距离传感器50 m处向着传感器方向接近的过程,采样频率F=1000 Hz,2048个点为一帧数据。使用本文提出的希尔伯特变换+CSEMD算法和希尔伯特变换+EMD算法进行处理并比较结果。

首先通过希尔伯特变换提取二者的包络线相当于对原信号进行了解调。去掉包络线偏置,对其进行EMD分解,可得到EMD分量如图18和图19所示。

图18 人员信号EMD分解

图19 车辆信号EMD分解IMF1-5

再将信号的IMF与原始信号进行协方差运算,筛选出协方差最大和最小的IMF进行相减取平均,并加在原始信号中,再对其进行EMD分解,得到的CSEMD分量如图20和图21所示。

图20 人员信号 CSEMD分解

图21 CSEMD车辆信号IMF1-5

可以看出,EMD分解人车信号所得的IMF2与CSEMD的IMF1等效,且都包含了显著的特征信号:人员信号对应的IMF有效提取出了人员脚步行走较离散的特征信号,车辆信号对应的IMF提取出了车辆运动较为连续的特征信号。同时,车辆信号的幅值都提高了50%以上。

但其模态混叠段的幅值均出现了下降。其中人员信号的模态混叠幅值降低了。其中人员信号模态混叠段幅值降低了80%,车辆信号模态混叠段幅值降低了50%。EMD的IMF2与CSEMD的IMF1如图22~图25所示。

图22 EMD人员信号IMF2模态混叠段

图23 CSEMD人员信号IMF1模态混叠段

图24 EMD车辆信号IMF2模态混叠段

图25 CSEMD车辆信号IMF1模态混叠段

最后,可采用CSEMD分解得到的IMF1与IMF2进行统计学方面的分析,从而得出特征指标。笔者在本文中使用方差阈值、平均值、中位数、峭度、自动编码器算法来提取特征。将2S信号分帧为20段,计算每段的特征值。方差超过阈值的点则视为一次有效脚步信号。将信号的脚步信号量作为一个特征量。同时,使用互相关函数对分帧信号进行特征提取。若相关系数大于阈值,则将该帧视为脚步信号,同样也可作为一个特征量。经过大量数据比对和统计,车辆由于是连续信号且信号频率不稳定,其脚步特征量一般小于人行走信号。而人行走无论快慢,每秒步频大约为3~4步,因此脚步信号量值较高且稳定。

3.3 实验结果与分析

总结前面的步骤,整个算法流程图如图26所示。

图26 算法流程图

将本文算法所得的两个特征量、过零点与峭度、直接EMD分解所得特征量投入随机森林算法中进行训练并测试,车辆训练样本数量为100组,人员训练样本数量为100组,车辆测试样本数量为100组,人员测试样本数量为100组,测试样本和训练样本相互独立。其中样本均为在阴天与小雨,风力不高于6级,在拥有均匀硬土质地的公园所采集。其中车辆信号为2吨家用小轿车以40 km/h的速度从距离传感器150~10 m处匀速驶近时采集的各距离样本,人员信号为体重为80 kg的单人以正常步行速度从距离50~5 m处匀速走进时采集的各距离样本。

所得结果如表1所示。

表1 本文算法与传统算法识别结果比较

由表1可知,在使用同一种分类算法的情况下,最简单最传统的零点+峭度算法从结果来看完全无法在野外环境中识别人员和车辆。两个特征量在远场和近场环境中其结果完全不同甚至所得结果相反,造成这种现象的原因是远场信噪比较近场更低,因此在远场环境中所得到的特征量更偏向于是噪音本身的特征量。

而使用EMD分解所得特征量识别率偏低,且识别成功的样本多为近场样本,实用性偏低。

直接对远场信号进行EMD分解会造成比较严重的模态混叠,从而影响后续的特征量提取,最后造成信号识别结果错误。同理,使用希尔伯特变换提取包络线后再对包络线进行EMD分解虽然可以改善模态混叠的现象,但其仍然对识别率有较大影响。使用本文算法可以有效改善模态混叠现象,使识别成功率得到较大提升,在远场和近场环境下均有良好表现。且相对其他方法计算量并没有太大提升。

4 结束语

本文针对在野外环境中对人车地震动信号进行正确识别这一问题,提出了通过希尔伯特变换提取包络线来实现降噪,并将降噪后的信号利用改进型EMD分解方法——CSEMD分解来获得具有特征量的IMF分量,再利用一些统计学方法提取特征量并将其送入随机森林分类算法中进行人车识别。实验结果表明:本文使用的识别算法相比于传统算法结果更好,更可用于实际,且具有较好的抗噪性能。下一步工作准备在此基础上尝试使用其他机器学习算法,进一步优化CSEMD分解算法效率并改进包络线提取算法,从而降低运算量同时提升识别正确率;优化算法准确度,使其可以在恶劣天气(如下雨大风等情况)进行检测;同时将该算法应用于诸如无人机飞行噪声等其他目标探测中,提高其泛用性。

猜你喜欢
希尔伯特包络线信噪比
两种64排GE CT冠脉成像信噪比与剂量对比分析研究
一个真值函项偶然逻辑的希尔伯特演算系统
下一个程序就是睡觉
有趣的希尔伯特
自跟踪接收机互相关法性能分析
基于深度学习的无人机数据链信噪比估计算法
抛体的包络线方程的推导
低信噪比下基于Hough变换的前视阵列SAR稀疏三维成像
椭圆中由两垂直直线引出的“包络”
希尔伯特的故事