语音信号的多小波脊提取算法研究

2013-11-13 07:24吕丽鹏张歆奕
科技视界 2013年6期
关键词:脊线时频小波

吕丽鹏 张歆奕

(五邑大学,广东 江门 529020)

0 引言

语音信号的处理是我们语音学中很重要的一项,它以语音学和数字信号处理为基础而形成的一个综合性的学科。现有的时频分析方法有很多,针对我们语音信号,常用的时频分析方法有短时傅里叶变换,窗口傅里叶变换,连续小波变换,希尔伯特变换等[1]。本文针对语音信号的特点,结合常用的得到语音信号时频图的语谱图方法,把小波脊提取方法运用到语音信号的频谱提取中,并对两种方法进行了对比。

1 方法原理

现代语音信号处理中,我们常用语谱图方法得到语音信号的时频谱,小波在语音信号的处理中运用的比较多,但是在语音信号的时频图取得方面运用比较少。

待分析的信号形式如下:

以上各个变量的物理意义是:b表示平移因子,如果变换过程中消除了偏移,b和时间t是意义对应的,因此A(b)表示时间点b上的振幅大小,Φ′(b)表示时间点b上的瞬时频率,Φ(b)表示时间点b上的瞬时相位[2]。

信号经过多个尺度的连续小波变换后,得到一个小波变换平面(小波变换域),小波变换域点的位置有平移因子b和尺度因子a决定,当信号的振幅A(t)和瞬时频率Φ′(b)在窗函数g(t)的支集上有较小的变化,并且假定式成立忽略一些误差,因此G(ω)在ω=0时最大,由式子可知,对每个b值,信号的连续小波变换模在ξ(b)=Φ′(b)处最大,相应的小波变换域上的时频点(b,ab)=(b,ω0/Φ′(b))成为脊点,其中ω0是小波基的汇总新频率,ab表示脊点上的尺度值。在每一个脊点,式子近似为

对上式做进一步分析可知,脊上的数据表现出和原信号最相似的特性,脊的起伏变化对应着信号幅度的变化;脊所在的位置的尺度值对应着信号瞬时频率的变化,各个信号分量的主要参数均可以从各自对应的脊上的信息中提取出来。

2 小波脊提取方法

常用的小波脊线提取方法有两种:基于模极大值的小波脊线提取算法以及基于相位信息的小波脊线提取算法。本文主要针对前者进行论述,至于后者有兴趣的读者可见参考文献[4]。

2.1 基于模极大值的小波脊线提取算法

由小波脊线理论可知,形式如下的信号:

当选择解析小波 φ(t)=g(t)exp(iω0t)对其进行连续小波变换时,在满足定的条件下,其连续小波变换的近似结果如下:

式子中,a是尺度因子,b是平移因子,A(b)是信号在b点的瞬时幅度,Φ′(b)是信号在 b 点的瞬时频率,G 是 g(t)的傅里叶变换,ξ=ω0/a 对上式求模,并作归一化处理有:

(1)首先对信号的带宽范围进行粗估计,然后设定小波变换的尺度因子范围。

(2)离散化尺度因子。选定一个尺度因子间隔△a,在尺度因子范围内,每隔△a,对信号作一个尺度的连续小波变换。一共要做a个尺度的连续小波变换。

(3)对于每一个b点,搜索小波变换结果的模极大值所对应的尺度ab,然后将搜索得到所有点(b,ab)连接起来,作为提取到的小波脊线。

这种求模极大值的方法由于要计算多个尺度下的连续小波变换,因此它的计算速度慢[5]。另外,这种方法适用的条件是:在连续小波变换域上,模极大值对应的位置是唯一确定的,是对应着信号脊线的位置,如果噪声较弱,该条件还能满足,但是当噪声比较强是,则在变换域上不仅有信号对应的脊,而且会因为噪声的影响产生一些局部的极值点,从而对脊的提取造成影响,使得提取到的脊停留在局部极值上,而不能提取到真正的脊线,因此我们总结一下为了使我们在小波脊将信号的瞬时频率和瞬时幅度分离出来时取得一条明显的小波脊线,由小波脊的公式可得,必须满足两个根本条件:

(1)只有当小波的调制频率等于信号的载波频率时才能在小波变换域上呈现出小波脊,在小波脊上的信号的瞬时频率和小波的中心频率满足下式子:

其中ω0是弧度表示的小波基中心频率,ω是弧度表示的信号的瞬时频率,a是尺度因子。

(2)在小波的时窗范围内,信号的瞬时频率保持不变。

2.2 为小波脊提取算法实例

下图为一个运用小波脊提取方法提取获得频谱图的实例。本文利用MATLAB软件对信号进行仿真。所取仿真信号为两个信号连接起来的信号,其中为两个信号分别为:

图1 小波脊提取时频图

图2 小波脊提取时间尺度三维图

图3 小波脊提取的脊线图

由图1可以看出,原来含有多个谐波分量的信号在经过小波脊方法得到的频谱图中,各个谐波分量十分清晰,其他噪音干扰等比较少,而后利用模极大值法可以得到两条很清晰的脊线,图4为小波脊提取的时间尺度和幅值的三维图。图3为最终得到的脊线图。

3 对于语音信号进行小波脊提取方法

与语谱图方法的对比

3.1 数据来源

本研究所采用的语音信号为阿拉伯数字的5,由录音软件cool edit完成,录音者为男性,采样频率为16000Hz。

3.2 试验方法

通过MATLAB编程分别运用快速傅里叶变换得到语谱图以及通过小波脊提取方法得到语音信号的频谱图。

方法一为语音信号进行加窗分帧然后进行快速傅里叶变换得到其语谱图。其中窗口函数为hanning窗,一帧处理2048个点,帧移值为32,得到的语谱图如下:

下图为同样的信号经过方法二小波脊提取方法得到的频谱图:

图4 语音信号的语谱图

图5 小波脊提取方法得到的时频图

图6 小波脊提取得到的时间尺度三维图

图4为语音信号进行加窗分帧时为了得到较好的频率特性,运用了hanning窗,并且窗长为2048,得出的频率分辨率为7.8125Hz。在窄带滤波语谱图中分辨率也相当高了,但是相对于图五通过小波脊提取得到的时频图来说,精细度就差了很多。小波脊的提取方法很好分辨出每个谐波,并且在非谐波以外的频率信号得到了很好的抑制,因此得到的时频图中看起来特别“干净”。

对于小波脊线的提取,因为语音信号中的谐波分量比较多所以得到的脊线也比较多,因此在脊线的提取时需要参照由小波脊提取方法得到的频谱图后对频率进行分段然后提取,这里就不一一赘述,有兴趣的读者可以参看文献[2]。

两者进行对比很容易得出,小波脊提取方法用于语音信号处理时,通过时频分析可以得到低频频率部分光滑平整,局部单点少整个画面清晰,频率分辨率高,这对于得到的时频参数后续用来进行基频分析,共振峰提取等有极大的帮助。

4 总结

本文针对语音信号的特点为了得到语音信号的频谱图,分别介绍了常用的语谱图方法以及小波脊提取方法,并着重介绍了小波脊提取方法对信号处理的实现方法,最后把小波脊提取的方法运用到语音信号处理中,并与语谱图方法得到的结果进行了对比,突出了小波脊提取方法在时频处理中的优点。

[1]蔡莲红,黄德智,蔡锐.现代语音技术基础与应用[M].北京:清华大学出版社,2003:236-238.

[2]张绪省,朱贻盛,成晓雄,等.信号包络提取:从希尔伯特变换到小波变换[J].电子科学周刊.

[3]Nathalie Delprat,Bernard Escudie Guillemain,Richard Kronland-Martinet,Philippe Ichamitechian,Bruno Torresani Asymptoic Wavelet and Gabor Analysis:Extraction of Instantaneous Frequencies[J].IEEE Transactions on information theory 1992,38(2):644-664.

[4]王兵,羿旭明.一种提取小波脊线的迭代算法[J].数学杂志,2005,25(3):295-298.

[5]袁晓,虞突厥邦.复解析小波变换与语音信号包络提取和分析[J].电子学报,1999,27(5):142-144.

猜你喜欢
脊线时频小波
构造Daubechies小波的一些注记
基于MATLAB的小波降噪研究
基于改进的G-SVS LMS 与冗余提升小波的滚动轴承故障诊断
基于时频分析的逆合成孔径雷达成像技术
树状结构引导下的脊线层次划分方法研究
对采样数据序列进行时频分解法的改进
基于FPGA小波变换核的设计
双线性时频分布交叉项提取及损伤识别应用
浅析《守望灯塔》中的时频
基于相位法的密集小波公共脊线提取方法