MATLAB在声音信号识别中的研究

2021-06-03 06:11华北电力大学电气与电子工程学院苏欣美
电子世界 2021年9期
关键词:响度频域时域

华北电力大学电气与电子工程学院 苏欣美

随着现代通信技术的发展,MATLAB对语音信号的处理识别也不断的发展。本文基于语音信号时域和频域相互转换的傅里叶变换原理,运用MATLLAB软件对不同性别声音信号进行时域和频域的信号处理并提取了不同性别声音信号的特征频率,对不同声音的时域和频域特性进行深度分析和研究。

语言是人类进行交流的重要工具,随着信息技术的快速发展,语音通信技术是信号处理与分析的重要发展方向之一,而声音信号的特征提取与检测是语音信号采集、分析与处理中的一个重要方面。如何采集声音信号并对采集后的声音信号的特征进行有效的提取对识别和处理声音信号有着重要意义。通过对男生、女生不同的音频信号进行采集,利用MATLAB实现对声音信号的频谱分析,得到男女生 性别不同的频率特征点,有效地区分了男女声音的不同,并通过实验验证了该方法的可行性和有效性。

1 声音信号的采集系统设计

1.1 声音信号的产生与特征

声音是由物体的机械振动产生的并以波的形式进行传播。人耳可听到的声音频率在20-10000Hz之间。人类的语言首先是经过大脑对对所要表达的思想信息进行语言编码,这些语言编码通过大脑的神经网络控制相应的声带肌肉产生有节律的机械震动从而产生声音。声音是一种声波,具有音质、音调、响度和音长等物理特征。其中音调和响度主要取决于声音信号的频率特征和时域特征。音调取决于声音的频率即声音的频谱特征,声音信号的频率数值越大音调越高;相反频率数值越小音调越低。响度主要取决于声音信号的幅值大小即声音信号的时域幅值,声音信号的时域幅值越大响度就越大,反之则越小。

1.2 基于声卡的声音信号采集系统设计

从前面的分析中可以看出声音的响度与音调可以通过声音信号的时域特征和频域特征进行分析。这里设计了语音信号的采集系统如图1所示。从图1可以看出声音信号通过语音麦克风的拾取送到计算机的声卡中,这部分为声音信号的采集。采集出来的声音信号的幅值随时间发生变化,即通常所说的信号的时域采集,可以用来分析信号的响度特征。为了分析信号的音调特征,必须对采集的信号进行频谱分析。利用傅里叶变换得到声音信号的频谱,通过MATLAB软件实现声音信号频谱的显示,从而提取男生与女生不同声音信号的特征。

图1 声音信号采集系统简图

2 声音时域-频域转换原理

由麦克风采集的声音信号为模拟时域信号x(t),该信号经过声卡进行抽样、量化,由模拟时域信号转换为离散时域声音信号x(n)。

根据离散傅里叶变换公式将时域离散声音信号转换为频域离散声音信号:

式中:X(k)—时域离散声音信号的傅里叶变换

N—声音信号的采样序列值

由于DFT运算较为复杂,复乘运算需要进行N2次,与N2成正比,因此运算时间过长。所以利用FFT快速傅里叶变换,复乘运算次数仅为Nlog2N,与N成正比,大大减少DFT的复乘运算,快速有效计算离散傅里叶变换,得到声音信号的频域波形。

3 实验分析

3.1 不同性别声音信号的时域提取

声音信号的获取是通过麦克风和声卡对男生和女生的声音进行采集。由Windows自带的录音系统来存储,存储的声音文件形式为(*.wav),然后利用MATLAB的文件调用指令和绘图指令来绘制男生和女生的声音时域信号如图2和图3所示。

从图2和图3男生和女生的时域音频信号可以识别出信号幅值的大小,即声音信号的响度。从声音信号的幅值随时间变化的情况很难区分男声和女声,也就是无法通过声音信号的响度特征来来提取男声和女声的声音信号特征。

图2 男生语音信号时域波形

图3 女生语音信号时域波形

图4 男生语音信号频谱图

图5 女生语音信号频谱图

3.2 不同性别声音信号的频域图像

为更好地识别男声和女声的声音信号特征,对采集到的语音信号进行频谱分析。利用matlab编程实现前述声音信号的时域-频域转换原理,男声和女声的语音信号频谱图像如图4和图5所示。

分析图4图5可知,男生和女生的频谱图特征区别较大。男生的声音频率主要集中在200Hz-300Hz左右的频率范围,而女生的声音频率集中在500Hz-700Hz的频率范围内,女生的声音频率普遍比男生要高,即可以通过提取不同性别声音的音调特征来区分男生和女生的声音。因此,可以利用不同声音所集中的频率范围对声音进行性别识别判断。

结语:本文介绍了一种男女生性别不同的声音识别方法,利用MATLAB的强大的编程功能对采集到的语音信号进行时域和频域的分析处理,并通过仿真实验验证了该方法的有效性,这一技术的实现为特定语言环境下男女生声音特征识别提供一种实用的方法。

猜你喜欢
响度频域时域
大型起重船在规则波中的频域响应分析
基于时域信号的三电平逆变器复合故障诊断
响度在节目制作和播出中的应用
频域稀疏毫米波人体安检成像处理和快速成像稀疏阵列设计
基于极大似然准则与滚动时域估计的自适应UKF算法
数字时代中节目响度平衡浅析
基于改进Radon-Wigner变换的目标和拖曳式诱饵频域分离
基于时域逆滤波的宽带脉冲声生成技术
台内音频响度控制方式
基于频域伸缩的改进DFT算法