被动声源定位中的时延估计分析*

2021-04-02 03:16史元元杨曼曼
西安工业大学学报 2021年1期
关键词:声源广义信噪比

胥 磊,冯 斌,史元元,杨曼曼

(西安工业大学 光电工程学院,西安 710021)

声学定位技术是通过一定结构的声音传感器阵列接收声源信号,并利用声学相关技术和信号处理技术对声信号进行处理,结合阵型几何原理及数学计算来确定声源位置的一种技术,在电话视频会议、智能机器人、机器故障诊断、耳障患者治疗及压力容器检测等领域广泛应用[1]。此外,声源定位技术在地震研究、航天舱体落点定位及军事领域中的炸点定位中也发挥着极为重要的作用[2-3]。

常用的声源定位算法主要有基于最大输出功率的波束形成方法、高分辨率谱估计的声源定位方法和基于时延估计的定位方法(Time Difference of Arrival,TDOA)[4]。上述声定位方法中,基于时延估计的定位方法计算量较小且原理简单,在生产生活和军事领域应用最为普遍[5]。该方法分成两个步骤:① 时延估计。利用同一声信号到不同传感器的声程差,计算出声源信号到达不同传感器的时间延迟;② 声源定位。利用阵列特定几何关系或搜索算法,结合时延估计值进行最终定位[6-7]。现有的声阵列定位技术主要采用互相关方法进行时延估计,该方法在理论条件下具有一定的抗噪声和抗混响能力,在信噪比较低和混响较强等情况下时延估计精度下降比较明显[8-10]。针对这一问题,通过对传统互相关法进行改进,引入谱减法和互功率谱频域加权法(Cross-power Spectrum Phase,CSP)进行时延估计,分析在不同信噪比下时延估计精度,以期实现更为准确的声源定位。

1 时延估计

1.1 基本互相关法

通过搜索两个声音信号的互相关函数曲线的最大值,来估计两个信号的时延[10]。令S为声源,M、N为阵列中两个不同声音传感器,xi(t)(i=1,2)为M拾取的信号,xj(t)(j=1,2)为N拾取的信号,可表示为

xi(t)=s(t-τi)+vi(t),

(1)

xj(t)=s(t-τj)+vj(t)。

(2)

式中:s(t-τi)、s(t-τj)为声源信号;vi(t)和vj(t)分别为两声音传感器所收到的环境噪声;t为信号传输时间;τi、τj为声源到传感器M、N所用时间。假设s(t-τi)或s(t-τj)与vi(t)和vj(t)两两之间互不相关。则xi(t),xj(t)的互相关函数Rij(τ)为

Rij(τ)=E[xi(t)xj(t-τ)] 。

(3)

式中:E[·]为互相关计算函数;xj(t-τ)为时延信号;τ为两信号时间差,将信号模型代入式(3),可化简为

Rij(τ)=E[s(t-τi)s(t-τi-τ)]=Rss(τ-(τi-τj))。

(4)

式中:Rss(τ-(τi-τj))为声源信号s(t)的自相关函数;s(t-τi-τ)为时延声源信号。当τ=τi-τj时,Rij(τ)的峰值达到最大值。此时对应的τ值就是两传感器之间的时延值。传感器M、N的时延估计为

(5)

其中τ∈[-τmax,τmax],τmax为最大时延值。

实际环境下传感器所接收到的信号中都携带有不同程度的噪声,其最大峰值不够明显,甚至被干扰峰所淹没,使得时延估计值误差较大。

1.2 广义互相关法

在频域中对互功率谱函数进行加权处理,对信号进行白化处理和噪声抑制,以提高信号的信噪比,降低噪声功率。对处理后信号进行逆傅里叶快速变换(Inverse Fast Fourier Transform,IFFT),得到两信号之间的广义互相关(Generalized Cross Correlation,GCC)函数,可使函数峰值更为显著,有助于提高时延估计精度。广义互相关表达式为

(6)

1.3 谱减法改进

对初始音频信号进行快速傅里叶变换(Fast Fourier Transform,FFT),保存幅值和相角,利用前段仅存在噪声的特点,可计算出噪声段的能量均值。将原始信号能量中的噪声能量去除,对减噪后的信号能量进行开方,可得到减噪后的信号幅值,将初始相角加入可得到减噪后的信号。

基本谱减法消噪后有明显的“音乐噪声”,适当提高过减因子α能减少“音乐噪声”,α过大又会让波形失真,为了减噪和保真兼顾,目前主要采用改进的谱减法:

(7)

(8)

1.4 时延估计

广义互相关法中使用加权函数,可增加信号中有效频谱所占权重,有助于提升时延估计的精度,当信噪比低时,时延估计性能受到严重影响。在此基础上使用改进谱减法对信号进行减噪滤波处理,采用CSP加权的广义互相关法计算时延估计,以提高低信噪比环境下的估计精度。采用基于谱减法的广义互相关法求取时延,原理框图如图1所示。

图1 时延求解原理Fig.1 Principle of time delay solution

xi′(t)为xi(t)谱减后的信号;xj′(t)为xj(t)谱减后的信号;xi(n)为xi′(t)经过FFT处理后的信号;xj(n)为xj′(t)经过FFT处理后的信号。

2 时延估计及分析

数据采集在低噪声、低混响环境下进行,利用高速数据采集卡对有固定间距的2个声音传感器所接收到的音频信号进行采集。

2.1 广义互相关法时延估计

对原始信号添加不同信噪比的随机噪声,进行噪声实验,对比Roth处理器、平滑相干变换(Smooth Coherent Transformation,SCOT)和CSP的互相关峰值来判断时延估计的精度。主峰越凸显,时延估计精度越高。信噪比(Signal to Noise Ratio,SNR)为5 dB和0 dB时,几种常见广义互相关函数如图2~3所示。由图2可知在较高的信噪比情况下,不同广义互相关函数均有明显的主峰,均可精确地估计出时延值。由图3可知,当信噪比较低时,不同广义互相关函数的时延估计精度均受到噪声严重影响,不同程度地出现了干扰峰,其中Roth加权和基本互相关的真实峰值几乎被淹没。上述方法都无法准确地估计出时延值,相比之下CSP加权法抗干扰性更优。

图2 信噪比为5 dB时的互相关结果Fig.2 Cross correlation results when SNR is 5 dB

图3 信噪比为0 dB时的互相关结果Fig.3 Cross correlation results when SNR is 0 dB

2.2 基于改进谱减法的广义互相关法时延估计

利用带噪的纯净语音数据,叠加不同信噪比的高斯白噪声,使用改进后的谱减法对带有噪声的信号进行降噪,结果见表1。

表1 不同信噪比下去噪效果Tab.1 Noise removal under different SNR

从表1中可以看出,改进的谱减法具有良好的减噪效果。不同信噪比下的减噪效果有所不同,初始信噪比越低时,该方法去噪效果越好。文中对0 dB信号进行去噪,如图4所示。该方法提高了信号信噪比,保留了信号的信息特征。

图4 改进谱减法处理后的信号Fig.4 Improved spectral subtraction after processing the signal

将谱减法加入广义互相关法中,在信噪比为0 dB情况下对初始信号进行谱减处理,采用SCOT和CSP加权函数,对处理后的去噪信号进行广义互相关处理,结果如图5所示。

图5 谱减法降噪后两信号的广义互相关函数Fig.5 GCC function of two signals after noise reduction by spectral subtraction

由图5可知,谱减法降噪后两信号的广义互相关函数峰值变得非常显著,时延估计精度得到了显著的提升,相比之下CSP加权函数性能更优。

2.3 时延误差分析

为了检验基于谱减法的广义互相关法(General Cross Correlation Method,GCC)时延估计性能及鲁棒性,采用不同信噪比下多组时延数据的均方差来衡量文中所提算法的时延误差大小和鲁棒性。均方差越大,算法时延误差越大,鲁棒性越差。时延估计的均方差如图6所示。

图6 时延估计的均方差Fig.6 Root-mean-square error of delay estimation

由图6可见,信噪比较高时,两种方法的时延估计误差都比较小。随着信噪比下降,CSP加权的广义互相关法误差几乎呈指数增长,而采用谱减法的CSP加权广义互相关法受噪声影响很小,具有较好的鲁棒性。

3 结 论

对传统声源定位中互相关时延估计方法进行性能分析并加以改进,提出可基于谱减法的CSP加权广义互相关算法。该算法提高了时延估计精度,减小了低信噪比环境下时延估计误差,增强了定位系统的鲁棒性。在不同信噪比环境下采用文中所提算法进行时延估计时,该算法的时延估计精度和鲁棒性优于GCC-CSP算法,在低信噪比环境下表现尤为明显。

猜你喜欢
声源广义信噪比
管道有源噪声控制中壁面分布次级声源的空间分布优化
虚拟声源定位的等效源近场声全息算法
两种64排GE CT冠脉成像信噪比与剂量对比分析研究
一种基于麦克风阵列用于分离单极子和偶极子声源的方法
基于经验分布函数快速收敛的信噪比估计器
计算辐射噪声的面声源和点声源结合方法
The Last Lumberjacks
自跟踪接收机互相关法性能分析
基于深度学习的无人机数据链信噪比估计算法
一类特别的广义积分