一种实时处理的二维声源定位方法

基本信息

申请号 CN202010541028.1 申请日 -
公开(公告)号 CN111650559A 公开(公告)日 2020-09-11
申请公布号 CN111650559A 申请公布日 2020-09-11
分类号 G01S5/20(2006.01)I 分类 测量;测试;
发明人 詹五洲 申请(专利权)人 深圳市裂石影音科技有限公司
代理机构 深圳市中科创为专利代理有限公司 代理人 深圳市裂石影音科技有限公司
地址 518000广东省深圳市南山区桃源街道平山社区丽山路10号大学城创业园705室
法律状态 -

摘要

摘要 本发明公开了一种实时处理的二维声源定位方法,包括如下步骤:将麦克风阵列采集的音频数据写入DDR,对NIS帧前导噪声段做FFT运算,得出各帧的短时谱熵;对每一短时谱熵进行平滑滤波处理,计算处每一短时谱熵的最小值和均值,再以此计算得到阀值T1和阀值T2;判定各帧是有话帧或噪声,若为噪声,则输出结果为isSpeech标志为0,并返回azimuth角和elevation角都为0;若为有话帧,则进入下一步骤;通过改进SRP‑PHAT算法,分两步进行声源定位,分别计算出azimuth角和elevation角;最后输出isSpeech标志为1,声源定位为(azimuth,elevation)为(,θDOA)。本发明技术方案结合VAD算法和改进SRP‑PHAT算法的策略,并且采取azimuth角和elevation角分步定位的方法来解决二维声源定位的精度、稳定性和计算量的问题。