基于脑功能网络深度学习的车内噪声评价模型

2020-06-03 00:43邹丽媛宋桂秋
机械与电子 2020年5期
关键词:响度编码器噪声

邹丽媛,王 宏,宋桂秋

(1.东北大学机械工程与自动化学院,辽宁 沈阳 110819;2.辽宁水利职业学院,辽宁 沈阳 110122)

0 引言

伴随我国汽车产业发展速度的加快,人们越来越注重乘车的舒适度。NHV性能对乘车舒适度具有直接性影响,成为人们在购车过程中首要考虑的重点指标之一。

发动机器的尖锐度、周期和响度等都会在一定程度上对发动机噪声烦躁度的主观感知造成直接性影响。声品质评价方法应运而生,其评价流程概括如下:第一,进行评价小组的创立,致力于通过借助多重回归法,就所提取的噪声响度、尖锐度以及粗糙度等客观物理参数进行客观量化模型的建立,从而达到主观进行噪声评价的目的[1-4],心理声学由此发展而来。由于高端轿车对车内声品质的高要求,心理声学的发展得到极大支持。

近年来,越来越多的国内外研究人员将脑电方法用于噪声暴露的研究,发现噪声暴露可改变中枢神经系统,且其影响程度与噪声的类型和声压级相关。一部分研究人员使用ERP时域分析方法,发现噪声环境睡眠的受试Nogo的P3成分的幅值比安静环境睡眠的受试者明显降低[5],噪声环境下P300的成分的幅值显著提高[6],噪声声压级升高,可导致N1成分的幅值降低、P2成分的幅值升高,额区变化最为显著[7]。一部分研究人员研究了多种噪声环境下,脑电节律特性的变化[8-11]。

相比与功率谱密度分析,ERP时域分析等方法,本文使用的基于图论的脑功能连接复杂网络可以反映出不同频段各个导联间的关系,将大脑的神经系统由基于图论的复杂功能网络体现,更能直观地反映出噪声对大脑功能连结性的影响[12-14]。与此同时,深度学习算法在图像识别和语音识别等人工智能领域广受关注。在汽车产业向智能检测与制造方向发展的当下,本文将脑电研究与深度学习相结合并引入车内噪声评价中来。

1 实验材料和实验方法

1.1 噪声采集及被试选取实验方案及设备

本文主要选取某高端品牌的轿车、某中端品牌的吉普车及某型号的城市客车三款车型,每个车型各选1台,平均车速分别控制在30 km/h,50 km/h,80 km/h和静止但不熄火共4种状态。就其车内噪声状况进行每次时长为8 min的车内噪声录制。其中噪声采集位置均设置于驾驶员座位上的人耳所在位置。而后由10名专家组成的专家组对12个车内噪声进行评分,采用10级评分(0为舒适,10为烦躁)。

另外,在实验人员选取方面,主要选取受试者22名,男女分别11名,年龄22~40岁左右。受试者均无不良身体状况或听力障碍。要求所有受试者在实验之前的48 h内不准饮酒、喝咖啡以及使用其他药物等。实验在一个灯光相对昏暗且较为安静的封闭环境内展开。各受试者均坐在舒适的靠椅上,使用双声道音箱随机播放车内噪声,同时其采集脑电信号。

1.2 实验方案及设备

实验具体流程如下,首先采集1 min的静息脑电。然后,使用相同音量随机播放每个刺激噪声音频,同时采集被试者的脑电信号,每次实验中间间隔10 min供被试者休息,并消除组间影响。实验场景如图1所示。

图1 实验示意

选用Emotiv system的便携式脑电信号采集仪Emotiv EPOC采集脑电信号,其采样频率为128 Hz,共14个电极,以10~20导联系统国际标准放置,电极位置如图2。其中参考电极位于双侧耳后乳突处。

图2 Emotiv EPOC电极位置

2 研究方法

2.1 基于同步似然的脑功能网络构建

将时间序列xk,i(k表示通道,k=1,…,M;i表示离散时间,i=1,…,N)延迟嵌入m维空间

Xk,i=(xk,i,xk,i+τ,xk,i+2τ,…,xk,i+(m-1)τ)

(1)

τ为延迟时间;m为嵌入维数。

通过以每个时间序列k与时间点i来对嵌入向量相互之间的距离加以界定,可以得出嵌入向量小于距离ε的概率为

(2)

| |表示欧几里得距离;θ为Heaviside阶梯函数,当x≤0时,θ(x) =0,当x>0时,θ(x) =1;ω1和ω2则代表2个时间窗,其中,ω1表示自相关的Theiler校正,ω2代表锐步同化测量时间分辨率的时间窗,并基本满足ω1≪2≪N的条件。

基于每个k和i,就临界距离εk,i的值加以确定,εk,i由参考概率Pref确定(Pref≪1)。

通过对每个成对的离散时间(i,j)进行确定后,当窗ω1< |j-i|<ω2时,嵌入向量Xk,i和Xk,j之间的距离要比临界距离小,其通道数

(3)

Hi,j的值在0到M之间。

对于通道k和离散时间(i,j),定义同步似然系数Sk,i,j

(4)

|Xk,i-Xk,j|≥εk,i,Sk,i,j=0

(5)

对所有j取均值后,可以得到同步似然Sk,i为

(6)

对脑电信号分析时,Pref=0.05。可以结合数据在时间和频率方面的特性,进行最佳延迟时间与嵌入维度的选择。具体参数数值设置如下:延迟时间为7,嵌入维度为7;ω1为84;ω2为283。

2.2 基于SAE的特征提取

近年来,针对深度学习的研究深受广大学者的关注,深度学习可以学习到人工难以提取的有效特征,大大缓解机器学习模型对特征工程的依赖。特征提取过程要求对工程领域有非常深入的理解,使用特定算法提取特征。而深度学习,可以模仿人脑对特征进行逐层扫描,通过多层神经网络的特征学习,提取重构得到有意义的高阶特征。此外,脑电信号是非线性信号,其中参杂大量非稳态噪声,本文使用基于最大相关熵的鲁棒栈式稀疏自编码器RSAE[15]提取特征,结合回归分析算法构建噪声烦恼度评价模型。

将delta,alpha和beta 3个频段的脑功能网络邻接矩阵重塑为1×(30×30×3)=1×2 700的一维向量,作为RSAE的输入,经过4层自编码器提取第四层高阶特征作为回归模型的输入,输出估计烦躁度数值。

自编码器(autoencoder,AE),即可以使用自身的高阶特征编码自己。自编码器也是一种神经网络,它的输入与输出是一致的,如图3所示。借助稀疏编码的思想,使用稀疏的高阶特征重构自己,自编码器的学习过程是无监督的。假设其输入向量为X(包含偏置bias数值),权值矩阵为W,激活函数为f(x),提取的特征向量为H。其自编码与解码的过程为

H=f(WX)

(7)

(8)

RSAE是多个自编码器的级联,n个AE按顺序训练。第一个AE训练完成后,将编码器的输出作为第二个AE的输入,以此类推。如图3所示,其中图3a为第一个自编码器提取得到一阶特征和为第二个自编码器提取得到二阶特征。通过预训练得到各阶特征,将其堆叠如图3b所示,此时网络与神经网络相同。

图3 SAE示意

本文使用四阶RSAE,将第四阶特征作为之后回归模型的输入。其中第一层包含2 048个元素,第二层包含1 024个元素,第三层包含512个元素,第四层包含128个元素,即最终提取128个四阶特征作为回归模型的输入。

通过反向传播机制使得目标输出与输入无限趋近。最大相关熵的损失函数J可以表示为

(9)

n为训练集样本个数;l为每个样本的长度;当J取最大值时,参数θ为最优解。

为避免网络过拟合,使用L2正则化,加入正则化后的损失函数

(10)

3 结果讨论

3.1 基于传统心理声学声音品质的车内噪声评价

利用现普遍使用的心理声学声音品质客观评价模型对采集到的车内噪声进行评价。提取包括响度、尖锐度、粗糙度和抖动强度4项声音品质特征。

图4为静止状态下3种车型车内噪声与实验环境背景音的特征响度平均值随临界频带的变化曲线,其中实线为实验室环境,虚线为高端轿车车内噪声环境,双划线为中端吉普车车内噪声环境,点实线为城市公交车。从图4可以看出,在各个bark内噪声嘈杂度越高其特征响度越大。临界频带较高时,中端吉普车与高端轿车较为相似。实验室环境只在临界频带较低时有较为明显的特征响度。

图4 不同噪声的平均响度曲线

将各个噪声环境下的声音品质参数特征值统计如表1所示。包括不同环境下各声音样本的平均声压级、响度、尖锐度、粗糙度和抖动度。由表1可知:在相对安静的环境下,声音的响度、尖锐度、粗造度和抖动度都较低;而在相对嘈杂的城市公交车车内噪声环境下,声音品质参数都较高。

3.2 结果对比

进一步使用回归模型评估指标对各个构建脑功能连接网络方法进行比较。回归模型的评估指标包括平均绝对误差(MAE),均方误差(MSE),均方根误差(RMSE)和决定系数(coefficient of determination)等。

平均绝对误差MAE又被称为L1范数损失,能较好地衡量回归模型的好坏,但是绝对值的存在导致函数不光滑,在某些点上不能求导,将绝对值改为残差的平方,即均方误差MSE,为保证量纲一致,将MSE开方,得到均方根误差RMSE为

(11)

决定系数又称为R2score,其可反映因变量的全部变异能通过回归关系被自变量解释的比例,是一个无量纲化的评价指标。

(12)

当决策系数值为0时,说明模型不能预测因变量;当决策系数值为1时,说明是函数关系;当决策系数数值在0到1之间,表示模型的好坏程度。

表1 静止状态不同环境下声音品质参数统计平均值

前述指标对异常点(Outliers)较为敏感,若样本中含有一些异常值,会对以上指标有较大影响,而MAPE是一个相对误差值,其具有较好的鲁棒性,即

(13)

结果如表2所示。从表2观察可见,基于脑功能网络的车内噪声评价结果好于基于传统心理声学声音品质的车内噪声评价结果。同时基于深度学习方法SAE的回归模型评价结果均优于SVM回归预测结果。其中基于脑功能网络和SAE的回归预测方法表现最佳。

表2 不同回归预测方法的评价指标对比

5 结束语

本文利用同步似然构建脑功能网络,以功能脑网络作为输入基于深度学习堆叠自编码器算法构建了一个性能良好的车内噪声评价模型。

a.采集不同车型下的车内噪声,由专家组对其进行车内噪声评价。采集受试者暴露于不同噪声下的脑电信号,预处理后使用同步似然方法构建脑功能网络,该方法可以计算不同导联间线性和非线性耦合关系,反映不同脑区间信息传递、加工、处理的状态。

b.使用四层SAE算法自主学习脑功能网络特征,实现车内噪声评价,该SAE模型平均决定系数高达98.69%,高于SVM回归方法。并与基于传统心理声学声音品质的车内噪声评价方法对比验证了使用脑功能网络进行车内噪声评价的可行性和有效性。

猜你喜欢
响度编码器噪声
融合CNN和Transformer编码器的变声语音鉴别与还原
噪声可退化且依赖于状态和分布的平均场博弈
响度在节目制作和播出中的应用
基于双增量码道的绝对式编码器设计
控制噪声有妙法
响度控制技术在福州电视台新闻综合频道的应用
铝合金地铁车内噪声测试及其响度分析
基于数字信号处理的脉冲编码器
光电编码器故障诊断技术研究现状与展望
一种基于白噪声响应的随机载荷谱识别方法