一种用于声纹信息采集的隔音箱

2023-10-22 01:45赵磊苗宁康小东
警察技术 2023年5期
关键词:声纹识别声纹隔音

赵磊 苗宁 康小东

1.新疆生产建设兵团第七师公安局 2.新疆生产建设兵团公安局

引言

近年来,非接触性电信网络诈骗案件呈现多发、高发态势,犯罪手段多样,犯罪团伙人员组成复杂,涉案地域广[3]。声纹识别技术借助其独特的生物学特征,成为新形势下打击非接触性电信网络诈骗案件的有力武器[4]。但是许多办案单位缺乏适合采集声纹信息样本的专业办公区间,同时市面上主流的科大讯飞、国音聚势等厂商生产的声纹信息采集终端设备在抑制噪音方面较弱,综合起来导致采集到的声纹信息质量不稳定,常有环境噪音、失真和回响,这对后期的声纹识别产生了直接影响。另外,声纹信息样本常采用多级、多次的人工审核方式,虽然严格控制了质量,但也因人员个体差异、听辨设备不同等造成审核不合格率高、工作效率低。因此,本文通过结构设计、声学处理方法的研究以及实验验证,设计了一种用于声纹信息采集的隔音箱,旨在减少回响和噪音,提高声纹识别准确率,提高工作效率。

一、解决方案

(一)总体设计

本文设计的隔音箱,主要由箱体、箱体内的隔音材料组成。箱体内有置物空间,用于放置采集设备;隔音材料贴附于箱体内壁,用于减少回响;箱体底部有数据线开孔。

此方案区别于现有隔音设施的优势在于,通过将采集设备放置于箱体内,利用隔音材料减少回响,有效提高声纹信息采集质量。此隔音箱相比专用的隔音房间来说,体积小,重量轻,制作方法简单,制作材料易获取,价格低廉,使用和移动都极为方便。

(二)材料构成

选择高密度瓦楞纸板材料制作箱体,并去掉一侧形成空腔。这种材料成型好,抗冲击力强,减震效果突出,能有效防止外部噪音传播,同时重量轻,易于采购。隔音材料采用环保聚氨酯隔音棉,不仅具有防火阻燃的特性,而且能够有效减少噪音和吸音,消除回响和共振现象,安装简单。金字塔形设计的吸音层可直接附着在箱体内壁上,形成完整的隔音箱体。箱体外侧采用户外油性塑料布进行封装,印刷了自制的隔音箱体标识,简约、美观、易识别。

按照以上材料制作完成的隔音箱长45厘米、宽35厘米、高30厘米,容积17.5升,重量约为500克(见图1,实际尺寸可根据现实情况更改)。

(三)材料成本

根据市场价格,单个隔音箱的材料成本为:采用瓦楞纸板材料制作箱体10元,采用环保聚氨酯隔音棉制作的隔音材料26元,采用户外油性塑料布制作包装40元。加上运输和人工成本,一个声纹采集隔音箱的总成本约为100元左右。相比于改造室内装修动辄数万元的费用,隔音箱的制作成本非常低廉。

(四)采集设备

采集设备只要能够放进隔音箱的空腔内即可正常使用,没有过多限制。本文选用了一款符合公安部《声纹数据采集终端技术要求(征求意见稿)》的专用声纹信息采集终端设备,该设备集成了8个矩阵式麦克风,具有高灵敏度和宽广的频响特性,能够准确捕捉被采集人的声纹特征。

(五)使用方法

使用隔音箱时,应将其空腔正对被采集人员,平放在桌面上。同时把采集设备水平放置于腔体底部中间,数据线可由底部开孔穿出,避免影响采集过程中的声音质量。

二、效果测试

声纹识别中要特别注意噪声强度及其带来的影响,结合共振峰走势,判断导致检材和样本之间差异的原因。实际上,由于噪音来源众多,环境复杂,而且噪音通常是随机的,因而从含噪语音中提取完全纯净的语音几乎是不可能的。对含噪语音的降噪处理只能是提高信噪比(SNR值),改善听觉效果和语谱图质量[5]。

(一)噪音分贝仪检测

在普通办公室区间内使用噪音分贝仪检测环境噪音和隔音箱内噪音,通过曲线测量得到声强级,单位记为分贝(dB),可以发现隔音效果的差异。差值越大,隔音效果越好。以下是每组数据的差值:

36dB环境噪音,隔音箱内为35.5dB,差值为0.5dB;

43dB环境噪音,隔音箱内为35.7dB,差值为7.3dB;

55.8dB环境噪音,隔音箱内为44.5dB,差值为11.3dB;65dB环境噪音,隔音箱内为52dB,差值为13dB。

这里要说明的是,分贝(dB)通常用来表示声音的强弱,是一个声音能量与基准能量之比取常用对数的“级”的单位,因此它不能简单地用算术相加,而需按照对数运算法则进行[6]。其计算公式为dB=10log(声音能量值/参考声音能量值),此处的dB值为环境噪音和隔音箱内噪音的差值,声音能量值和参考声音能量值为环境噪音分贝值和隔音箱内噪音分贝值。根据此公式计算,将环境噪音和隔音箱内噪音的差值代入,然后求出环境噪音和隔音箱内噪音的倍数关系,可理解为隔音效果提升了多少倍。

当差值为0.5dB时,dB=10log(环境噪音/隔音箱内噪音)=0.5

移项得到:环境噪音/隔音箱内噪音=10^(0.05)

计算得到:环境噪音/隔音箱内噪音=1.122

因此,当差值为0.5dB时,环境噪音和隔音箱内噪音的比值是1.122,可理解为隔音效果提升了约1倍。

同样的方法,求出其他隔音效果dB值对应的环境噪音和隔音箱内噪音的比值,了解到隔音效果提升了多少倍:

当差值为7.3dB时,环境噪音/隔音箱内噪音=5.012;

当差值为11.3dB时,环境噪音/隔音箱内噪音=19.953;

当差值为13dB时,环境噪音/隔音箱内噪音=50。

因此,当差值分别为0.5dB、7.3dB、11.3dB、13dB时,对应的环境噪音和隔音箱内噪音的比值分别为1.122、5.012、19.953和50。即隔音效果分别提升了约1倍、5倍、20倍和50倍(如图2所示)。

根据上述数据,可以观察到随着环境噪音的增加,该声纹信息采集隔音箱的隔音效果显著提高。

(二)语谱图检测

当环境噪音在65dB时,在普通办公室区间内使用声纹信息采集设备进行了两次录音。两次录音内容一致,为同一男性念读文本内容,一次使用了隔音箱,另一次未使用。随后得到两段音频文件,时长约2分50秒,单声道,均为wav格式,采样率16kHz,采集精度16bit。通过听辨分析,使用隔音箱录制的音频质量更好,语音清晰可辨,而未使用隔音箱录制的音频则存在明显的噪音和回响。

使用声纹鉴定系统对两段录音的宽带语谱图进行分析比较。经检测,未使用隔音箱录制的音频信噪比(SNR值)为14.25dB,语谱图充满底噪,音节间的过渡不流畅,共振峰不清晰、间断不连续,语音特征反映不充分,无法满足识别要求。相比之下,使用隔音箱录制的音频信噪比(SNR值)为22.85dB,语谱图更为清晰,没有底噪干扰,音节间的过渡更加流畅,共振峰明显,语音特征反映充分,可以进行声纹识别(如图3所示)。

因此,使用本文设计的隔音箱可以显著提高录音质量,达到更高的精度和准确度。在声纹识别等需要高品质语音录音的场合中,隔音箱的应用显得十分关键和必要。

三、应用推广

经过多方测试,该隔音箱成功解决了环境噪音差、设施改造困难、样本质量低和工作效率低等问题。根据数据统计,自2022年5月本单位全面使用声纹信息采集隔音箱以来,声纹信息审核通过率已从此前的全年70.6%上升到92.5%。

本文设计的隔音箱凭借其体积小、重量轻、易制作、价格低廉等特点,非常适合面向全国基层办案单位推广,有推广应用的必要性和可行性。

四、结语

针对声纹识别领域中的环境噪音问题,本文提出了一种声纹信息采集隔音箱的设计与实现方法。实验验证及实际应用表明,此方法可以显著提高样本质量和声纹识别准确率,具有实用价值。通过不断优化设计和改善制作工艺,未来该隔音箱会有更好的应用效果。

猜你喜欢
声纹识别声纹隔音
充满“炫技味”的发烧级耳机 SHURE AONIC 5隔音耳机
屏幕即指纹识别
声纹识别中的区分性训练
跟踪导练(二)(4)
基于i—vector声纹识别上课点名系统的设计与实现
面向移动终端的语音签到系统
基于数字水印的人脸与声纹融合识别算法
基于玻璃纤维增强隔音复合材料的层合板的隔音性能
从此隔音尘
声纹