基于深度学习的麦克风阵列声源定位方法及声源识别方法
基本信息
申请号 | CN202110465688.0 | 申请日 | - |
公开(公告)号 | CN113514801A | 公开(公告)日 | 2021-10-19 |
申请公布号 | CN113514801A | 申请公布日 | 2021-10-19 |
分类号 | G01S5/22(2006.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I | 分类 | 测量;测试; |
发明人 | 陈思应 | 申请(专利权)人 | 成都启英泰伦科技有限公司 |
代理机构 | - | 代理人 | - |
地址 | 610041四川省成都市高新区天府五街200号菁蓉汇4号楼A座12层 | ||
法律状态 | - |
摘要
摘要 | 基于深度学习的麦克风阵列声源定位方法及声源识别方法,包括如下步骤:设置麦克风阵列,所述麦克风阵列包括两个以上的麦克风,且全部麦克风位于同一平面;对麦克风进行两两分组,利用每一组麦克风进行声源位置定位,具体为:以两个麦克风连线为X轴,连线中点为坐标原点构建三维坐标系;计算声源相对坐标原点的方位角θ;确认声源角度后,再得到声源位置信息。本发明通过利用语音到达麦阵中各个不同位置麦克风的时延相关性获取声源位置,然后结合深度神经网络对语音进行增强,在本地实现了快速确定声源为人声还是非人声,减少语音产品中的误识别和误触发。 |
