时延估计的声源定位算法研究

2018-06-06 10:14李伟

电脑知识与技术 2018年7期

李伟

摘要：基于时延估计的声源定位算法是先求得时延，再根据时延来计算出声源的位置。因此时延估计的准确性决定了声源定位的准确性，而时延估计的精度会受到室内混响和噪声的影响，因此本文提出了一种改进后的PHAT加权算法。通过传感器矩阵模型采集声源的音频信号传到上位机并在Matlab进行算法仿真。结果表明改进后的PHAT加权算法结合牛顿迭代定位算法能够比较准确的对声源进行定位。

关键词：时延估计；广义互相关；声源定位；牛顿迭代

中图分类号：TP311 文献标识码：A 文章编号：1009-3044（2018）07-0220-03

Abstract： Based on the time-delay estimation of the sound source localization algorithm is to find the delay， and then calculate the sound source according to the delay position. Therefore， the accuracy of the delay estimation determines the accuracy of the sound source localization， and the accuracy of the delay estimation will be affected by the indoor reverberation and noise. Therefore， this paper presents an improved PHAT weighting algorithm. Through the sensor matrix model， the audio signal of the sound source is collected and transmitted to the host computer and the algorithm is simulated in Matlab. The results show that the improved PHAT weighting algorithm combined with Newton iterative positioning algorithm can accurately estimate the sound source Positioning.

Key words： Delay estimation； Generalized mutual correlation； Source localization； Newton iteration

麥克风阵列声源定位在语音识别、视频会议、回声消除等方面都有着十分重要的广泛应用。基于麦克风阵列的声源定位算法主要分三类：基于最大输出功率的可控波束形成方法[1]、基于高分辨率谱估计的声源定位方法[2]和基于时延估计的定位方法。三类定位方法中，基于时延估计的定位方法有良好的实时性和较高的定位精度，被作为声源定位中的常用方法。其中基于时间估计的声源定位方法分为两步[3]：第一步时延估计，根据阵元的间距和不同阵元之间接受同一声源信号的之间的延迟关系，求解出声源到达不同阵元的时延。第二步声源定位，利用搜索算法或几何算法得到声源所处的位置。其中时延估计研究广义互相关法和最小均方自适应滤波法，声源定位研究牛顿迭代定位算法[4]。本文通过介绍不同的时延估计算法并在Matlab上进行仿真分析，结果表明利用改进后的PHAT相位加权算法结合牛顿迭代定位算法能够实现更加精确的定位效果。

4 总结

本文通过介绍不同时延估计算法以及定位算法，以传感器矩阵为模型，在Matlab软件进行仿真测试，仿真说明改进后的PHAT加权算法比传统的自适应算法具有更好的抗混响和噪声的能力，结合牛顿迭代定位算法也具有好的定位能力。因此结合这两种算法能够更好的进行声源定位，同时能确保较高的准确性。

参考文献：

[1] 郭业才，朱赛男，张宁.自适应多通道双L型麦克风阵列声源定位算法[J].系统仿真学报，2015（7）：1556-1562.

[2] 张雷岳，张兴敢，刘超.麦克风阵列声源定位中时延估计的改进[J].南京大学学报：自然科学版，2015（1）：25-30.

[3] 叶诚，杨淑莹.基于到达时间差的声源定位算法与实现[J].天津理工大学学报，2015（4）：50-54.

[4] 刘霞，吴崧.牛顿迭代算法在声场定位中的应用[J].武汉工程大学学报，2014，36（7）：64-67.

[5] 茅惠达，张玲华.声源定位中广义互相关时延估计算法的研究[J].计算机工程与应用，2015（7）：138-142.

[6] 陈向阳，刘松，刘培.时延估计的声源定位算法及Matlab实现[J].武汉工程大学学报，2014，36（10）：42-45.

[7] 刘慧珠.基于麦克风阵列的声源方法估计算法研究[D].西南交通大学，2015.

[8] 郭亚峰，陈弘宇.多通道近场广义互相关算法研究[J].声学与电子工程，2013（1）：19-21.

[9] 屈军锁，侯晓宁，张继荣.四基站时差和牛顿迭代法的三维定位算法[J].西安邮电大学学报，2015（3）：36-40.

[10] 彭迎标，杨尊先，林志贤.基于传声器阵列的改进的PHAT-GCC语音定位算法[J].电声技术.2013，2（17）：62-65.

电脑知识与技术2018年7期

电脑知识与技术的其它文章: WEB应用与数据库安全关键技术研究; 国内用户驱动研究综述; 基于用户社交网络数据的人格倾向性分析及预测模型的建立; 基于语义WEB的黔南民族文化资源检索与共享技术研究; 基于大数据的大气监测研究; 一种基于MMTD与相似性算法的病毒检测算法