对麦克风阵列拾取的语音信号进行声源分离的方法及系统
基本信息
申请号 | CN201810648958.X | 申请日 | - |
公开(公告)号 | CN108735227B | 公开(公告)日 | 2020-05-19 |
申请公布号 | CN108735227B | 申请公布日 | 2020-05-19 |
分类号 | G10L21/0208;G10L21/0216;G10L21/028 | 分类 | 乐器;声学; |
发明人 | 代金良;景源 | 申请(专利权)人 | 北京三听科技有限公司 |
代理机构 | 北京名华博信知识产权代理有限公司 | 代理人 | 北京三听科技有限公司 |
地址 | 100176 北京市大兴区北京经济技术开发区荣昌东街5号3号楼8层KC015(集中办公区) | ||
法律状态 | - |
摘要
摘要 | 本发明提供一种对麦克风阵列拾取的语音信号进行声源分离的方法和系统。该方法包括:接收语音信号,并检测语音信号中的声源数量n;判断n是否大于1,若n>1,则计算各声源的波达方向角度值;将波达方向角度值按照大小顺序排序,并计算相邻两个波达方向角度值之差;判断所有角度间隔是否均大于或等于设定角度间隔阈值C,若是,则执行下一步,若否,则修正两个或多个波达方向角度值,并执行下一步;基于波达方向角度值和/或修正后的波达方向角度值对语音信号进行波束形成得到n个增强语音信号,并对n个增强语音信号执行盲源分离算法,得到相应于n个声源的n个分离的语音信号。该方法和系统以获得更优的声源分离性能。 |
