基于AR模型的变分贝叶斯独立分量分析算法研究

2019-10-18 09:33岩,
铁道学报 2019年9期
关键词:后验贝叶斯波形

徐 岩, 王 雷

(兰州交通大学 电子与信息工程学院, 甘肃 兰州 730070)

近年来,盲源分离算法因处理效果良好在信号处理领域得到广泛关注和应用。但传统的独立分量分析(Independent Component Analysis,ICA)方法在对语音信号分离时没有考虑噪声对混合系统的干扰,对观测信号和已知的先验信息没有充分利用,导致分离效果不理想。而变分贝叶斯分析(Variational Bayesian Independent Component Analysis,VBICA)算法继承了ICA算法的特点,即使不知道源信号相关参数,也可以通过观测信号确定出源信号中的独立成分,实现分离处理,充分利用了混合系统的先验信息,并且能在带有噪声的信号条件下分离出源信号,比传统ICA算法更具优势[1]。

1 盲源分离的基本模型

1.1 含噪的语音信号分离系统

盲源分离是指在源信号和混合传输信道参数不可知的状态下,尽可能把从传感器阵列获得的观测信号中所包含的源信号分离出来。通常有两种分离方法,一是根据源信号在信道中混合时是否存在时间上的延迟,可分为瞬时混合与卷积混合;二是根据混合系统源信号和观测信号间存在的对应关系,把混合系统分为非线性混合与线性混合。盲源分离算法最主要的目的是分离(解混合)矩阵的学习或估计,属于无监督学习范畴。针对实际的工程应用,主要研究含有噪声情况下的线性瞬时混合模型,其数学模型为

xt=Ast+nt

( 1 )

式中:xt=[x1,t,x2,t,…,xN,t]T为N个观测信号构成的向量集,st=[s1,t,s2,t,…,sM,t]T为M个源信号构成的向量集;nt=[n1,t,n2,t,…,nN,t]T为N个噪声信号构成的向量集,假设这些噪声不存在相关性;A为对应的N×M的混合矩阵;t={1,2,…,n}为构建的相应时间索引点t。

1.2 泛化自回归模型

为描述信号或数据等一些时间序列所包含的时间关系,常用时间序列数学模型进行建模,而自回归模型(Autoregressive Model,AR)[2]主要是利用时间序列的相关性计算采样点间的线性关系,其数学定义为

( 2 )

式中:xt为AR过程;rt为独立同分布时间序列,亦称新息序列,是离散白噪声信号;系数ai={a1,a2,…,ap}为AR模型的参数;u为模型阶数。

式( 2 )若用新息序列rt为混合高斯分布(Mixture of Gaussian,MOG)描述,可表示为

( 3 )

式( 2 )中,xt属于泛化自回归(Generalized Autoregressive,GAR)过程[3],当m=1时,此序列为高斯白噪声。采用这种模型进行建模,可以根据不同的噪声类型选择合适的数据,确保建立的模型其参数估计的结果稳定性更高。

2 变分贝叶斯分析

2.1 贝叶斯理论

贝叶斯推理方法原理见图1,其对应的后验概率密度[4]为

( 4 )

式中:Y为特定网络模型;x为确定出观测信号的数据集;p(x|W,Y)为参数W的似然函数;p(W|Y)为W参数的先验概率密度函数;p(x|Y)为归一化常数。

图1 贝叶斯推理方法原理

贝叶斯定理的核心思想是在观测数据的指导下,将参数的先验概率分布转变为后验概率分布。

在p(W|Y)中存在全部的约束条件相关的先验信息,可通过数据似然性p(x|W,Y)对模型产生数据的概率进行分析。在盲源分离处理过程中,ICA的主要作用是估计源信号,可先通过贝叶斯网络模型Y确定分离信号,再确定隐藏变量对应的后验概率分布,即可获得相应的源信号[5]。

2.2 变分贝叶斯学习

贝叶斯推理形式简洁,但在实际应用中,边缘似然函数需在高维空间做积分计算,计算非常复杂;为简化计算,引入变分贝叶斯学习,其原理是在保证与原问题尽可能相似的条件下提出一个更简单的问题版本。数据的似然性对数表达式为[6]

( 5 )

因为模型信度值与包含所有隐藏变量及模型参数W无关,故式( 5 )可简化为

( 6 )

( 7 )

( 8 )

再对参数近似逼近,把式( 8 )带入式( 7 )中得到

( 9 )

(10)

式中:λi为拉格朗日乘子。

令式(10)等于零,则有

(11)

式中:Zi为求导处理后得到的常量部分,在计算时若数据似然性一经确定,后验概率随先验概率参数的变化而发生类似的改变。

3 VBICA-GAR算法

3.1 GAR模型及其概率分布

相关统计研究发现,很多实际应用的语音信号,相应的临近点之间存在一定时间相关性,可通过GAR[8]近似表示,若源信号是平稳的或满足局部平稳要求,可以用GAR模型表示其时间特性

(12)

序列分布对应的MOG模型可表示为

(13)

式中:p(rm,t)包括Lm个高斯分量,且每个高斯分量是由混合均值um,qm、权重ρm,qm和精度βm,qm等参数来确定的。混合高斯模型的权重ρm,qm的先验分布取Dirichlet分布[9]

(14)

式中:H为本文选择的模型;c(ρ)为超参数,其相应均值的先验分布选择高斯分布

p(um,qm|H)=G(um,qm|b(u),c(u))

(15)

其中,b(u)、c(u)是超参数。

混合高斯模型精度的先验分布取Gamma分布为

p(βm,qm|H)=G(βm,qm|b(β),c(β))

(16)

式中:b(β)、c(β)也是超参数。

根据先前源信号模型和新息序列相关的概率分布,可得出源信号sm,t的条件概率分布为

(17)

由式(17)进一步推导可得

p(sm|wm,θm,H)=

(18)

定义W={w1,w2,…,wM}和s=(s1,s2,…,sM),尽管每个源信号存在相应的时间相关特性,但不同源信号间还是能满足相互独立的要求,s的条件分布表达式为

(19)

式中:wm为GAR系数向量,是先验分布的一个零均值高斯分布[10]。

3.2 基于VBICA-GAR的语音盲分离算法

对混合系统的各个分量建模后,可把变分贝叶斯学习法与GAR源信号模型相结合,对带噪语音信号进行分离。

定义α={α1,α2,…,αM}、γ={γ1,γ2,…,γM}和μ={μ1,μ2,…,μM}含噪混合系统模型的所有参数用Θ={W,α,ρ,u,β,A,γ,μ,Λ}来表示,则完整的带噪混合系统参数也可据此确定,带噪混合系统模型见图2。

图2 带噪混合系统模型

用变分贝叶斯学习法来进行盲源分离,首先需要求解源信号S和模型参数Θ的近似后验分布Q(S,Θ),其次再通过近似后验分布模型逼近源信号S相关的后验分布。设源信号和模型参数间满足独立性要求[11],同时满足Q(S,Θ)=Q(S)Q(Θ),即可通过最小化代价函数CKL求出近似后验分布。CKL为

(20)

在变分贝叶斯学习法中,根据Q(S)∝exp(〈logp(x,S|Θ)〉Q(Θ)),可以得到源信号S的近似后验分布

(21)

再按更新规则反复进行迭代处理,直到达到收敛性要求为止,收敛性判断可根据代价函数CKL来确定

(22)

(23)

4 仿真实验及评价

4.1 算法仿真

仿真环境以RIKEN[13]盲源分离工具包ICALAB为基础,运用ICALAB内置的丰富语音库,同时嵌入本文自编的程序进行了仿真实验。语音信号的采样频率为 8 kHz,采样点数为5 000个,分别在SNR=20 dB的高斯白噪声背景下对语音信号进行分离。SNR=20 dB时的两种算法的仿真实验见图3~图6。经VBICA-GAR算法分离后得到的四路语音源信号波形见图5,用经典的VBICA算法分离得到的四路语音源信号波形见图6。

图3 四路原始的语音源信号波形

图4 四路含噪混合语音源信号波形

图5 VBICA-GAR算法分离波形

图6 VBICA算法分离波形

通过观察以上两种算法分离处理得到的分离信号的波形图,在SNR=20 dB的噪声的条件下,VBICA-GAR和VBICA能从混合信号中有效的分离出原始的语音信号。通过对比可以看出,改进后的VBICA-GAR算法分离后得到的信号分离波形效果显著高于改进前的算法[14]。

4.2 串音误差评价

为客观评价语音分离效果,引入串音误差[15],可通过全局系数矩阵构造互通道干扰测量误差准则进行评价,其值越小则两种波形间的相似程度越高,如果其值为零,则两种信号的波形则完全一致,测试结果见图7。由图7可见,在不同强度的噪声干扰背景下,VBICA-GAR的分离性能优于经典的VBICA方法和其他传统的ICA方法,且噪声干扰越大,本分离算法的鲁棒性也越强。

图7 不同信噪比下各算法的串音误差

5 结束语

本文针对语音信号的时间相关性这一特性,通过引入GAR模型来进行描述和建模,提出了VBICA-GAR算法来进行语音信号的分离。在分析AR模型的基础上,建立了带噪混合系统相应的源信号和观测信号等分量概率分布模型,并通过变分贝叶斯学习法,提出了VBICA-GAR分离算法,建立了相对应的参数更新规则,给出了初始化参数值和迭代方法。算法在贝叶斯学习框架下将噪声作为一种信号和语音信号的时间结构一起建模分离,提高了分离精度。但VBICA-GAR分离算法在算法复杂度上还有改善空间,仍需在今后做更深入的研究。

猜你喜欢
后验贝叶斯波形
基于时域波形掩护的间歇采样干扰对抗研究
一类传输问题的自适应FEM-BEM方法
基于贝叶斯定理的证据推理研究
基于贝叶斯解释回应被告人讲述的故事
基于Halbach阵列磁钢的PMSM气隙磁密波形优化
基于贝叶斯理论的云模型参数估计研究
用于SAR与通信一体化系统的滤波器组多载波波形
全新迈腾B7L车喷油器波形测试
租赁房地产的多主体贝叶斯博弈研究
租赁房地产的多主体贝叶斯博弈研究