基于MATLAB的语音增强技术研究

2018-06-09 11:37李敏杰

科学与财富 2018年10期

李敏杰

摘要：在增强语音的过程中，综合考虑语音特性、噪聲特性以及听觉特性，既要提高信噪比，也要不失真，所以为去除不同的噪声，需要不同的语音增强算法。基于上述原因，本文以纯净语音和噪声语音的特性为依据，介绍不同的语音增强方法处理后语音的质量好坏。

关键词：语音增强；语音特性；噪声特性

1.前言

在生活中，语音信号往往都带有噪声，在对语音信号进行进一步处理（语音识别、语音合成）之前，需要对带噪语音进行语音增强处理。对带噪语音进行去噪处理时，要尽可能多的保留有用信号，达到有效传递信息，实现语音增强的目的，本文针对不同信噪比的带噪语音进行语音增强，并对语音增强后质量好坏进行评价。

2.语音增强理论依据

干净语音和噪声以及二者结合的带噪语音的特征是进行语音增强的理论依据。根据上述三类语音的语音特性，需要对其进行多方面分析，其中包括了解其时域特性以及频域特性。

2.1 纯净语音

语音从人的口腔发声出来的瞬间，如果周围的环境是安静的，则发声的语音将没有被周围的噪声所污染，我们把它称作纯净语音信号。语音在不同帧长下服从不同的分布，比如说，进行分帧时，一般取20-30ms的帧长，此时，语音较符合伽马分布和拉普拉斯分布。对于帧长无穷大时，认为语音此时服从高斯分布。

2.2 噪声特性

干扰噪声从叠加方式上可以分为两种：加性和非加性。研究表明，对于非加性噪声经过变换，能够实现转换为具有加性噪声的特性。为了便于理论说明，这里仅讨论加性噪声的情况。而加性噪声里不仅有平稳噪声，还有非常难去除的非平稳噪声。平稳噪声的变化较慢，特性不明显，而非平稳噪声变化迅速，从含有非平稳噪声的带噪语音中恢复干净语音信号相对困难。所以，在研究语音增强之前，一定要了解想要去除的噪声类型，根据噪声的时域和频域特性研究不同的算法。

3 语音增强技术

本章重点介绍一些在实际中常用的经典的语音增强算法以及关于它们的改进算法，对结果进行评价。

3.1 谱减法及其改进算法

谱减法是最常用的语音增强算法，谱减法认为噪声与语音相互独立，进而估计出噪声语音的功率谱，利用已知带噪语音的功率谱减去和估计出的噪声语音的功率谱相减，利用经过FFT变换得出的相位角，可以恢复出干净语音信号。谱减法是一种十分经典，但是简单好用的方法。

由于对带噪信号和噪声信号谱估计的偏差，经过谱减法增强后的语音有明显的“音乐噪声”，传统的谱减法多用的是周期图法进行谱估计，其只是一个数据窗，引入的多窗谱估计用到了同一数据序列的多个正交的数据窗，对其分别计算出直接谱，最后根据求到的谱求取平均值，该方法的估计方差更小，故而谱估计更精确。

3.2 最小均方误差算法及其改进算法

最小均方误差估计（）进行语音增强时也要先估计出噪声功率谱，此增强方法主要以统计理论为基础，利用统计特性可以实现初始化统计参数，实现最优滤波。经由MMSE增强的目的就是为了得到原始语音信号的的估计，利用处理后语音的幅值估计对均方误差进行计算求取最小值。

对于人耳来说，频谱分量的幅度才是最重要的，即人耳对语音强度的听觉感受与幅度谱的对数成正比关系。研究表明，基于对数失真准则可以得到更好的频谱估计，故而对基本MMSE的估计谱进行对数修正。

4 实验仿真及结果分析

针对本章前面论述的各种语音增强算法，应用MATLAB仿真软件，对谱减法及其改进算法、最小均方误差法及其改进算法，进行仿真实验，从信噪比、分段信噪比两个方面对增强前后的语音进行对比分析，得出实验结论。实验所用数据：实验室环境下，基于LabVIEW和NI八通道数据采集卡NI4472采集的语音，共4男4女，每人9段10秒的中文干净语音，及噪声库noisex-92里的工厂噪声factory1，语音增强算法通常工作在0～15 dB的SNR环境中，本文主要对0dB的带噪语音进行研究，结果如下所示：

5.结论

本文介绍了基于气导语音的语音增强的多种算法，谱减法增强效果明显，但增强后的语音多含有音乐噪声。最小均方误差法达到了语音可懂度和信噪比的折中，但在强背景噪声环境下，残留噪声和音乐噪声都很大，且运算量大。每个算法均有其优缺点，本文根据上述各算法的缺点，均有其改进算法，取得了明显的效果。

参考文献

[1]朱颖莉. 基于多传感器的语音增强技术研究. 硕士学位论文，华南理工大学，2013.

[2]张贤达，保铮. 非平稳信号分析与处理.国防工业出版社，北京， 1998.

[3]隋璐瑛，张雄伟，黄建军等. 一种基于非负矩阵分解的语音增强算法[J]. 军事通信技术.

[4]戴礼荣，张仕良. 深度语音信号与信息处理：研究进展与展望. 数据采集与处理. 2014， 29（2）：172-179.

[5]赵力.语音信号处理.北京：机械工业出版社 2003：272-273，282-283.

[6]余建潮，张瑞林. 改进增益函数的 MMSE 语音增强算法[J]. 计算机工程与设计， 2010 （14）： 3287-3289.

[7]T. erkmann， M. Krawczyk. MSE-optimal spectral amplitude estimation given the STFT-phase[J]. Signal Processing Letters， IEEE， 2013， 20（2）： 129-132.

科学与财富2018年10期

科学与财富的其它文章: 我国商业银行金融创新现状浅论及建议; 对云南省文山州壮族传统体育项目抛绣球的研究; 浅析农商银行现代发展的机遇与对策; 成渝城镇密集区空间紧凑发展和规划的设计分析; 机械制造智能化发展趋势探析; 现代化机械装配自动化的应用与发展