一种基于混合式概率模型的多通道声源分离方法
基本信息
申请号 | CN201911257725.8 | 申请日 | - |
公开(公告)号 | CN112951264A | 公开(公告)日 | 2021-06-11 |
申请公布号 | CN112951264A | 申请公布日 | 2021-06-11 |
分类号 | G10L21/0272;G10L21/0232;G10L21/0216;G06N3/04;G06N3/08;G06K9/62 | 分类 | 乐器;声学; |
发明人 | 张鹏远;陈航艇;颜永红 | 申请(专利权)人 | 北京中科信利技术有限公司 |
代理机构 | 北京方安思达知识产权代理有限公司 | 代理人 | 陈琳琳;杨青 |
地址 | 100190 北京市海淀区北四环西路21号 | ||
法律状态 | - |
摘要
摘要 | 本发明公开了一种基于混合式概率模型的多通道声源分离方法,所述方法包括:计算待分离的多声源信号的短时傅里叶频谱,基于预先建立的深度聚类网络提取每个时频点的声源嵌入向量;将声源嵌入向量输入混合式概率模型,利用期望最大化算法迭代混合式概率模型,模型收敛后输出每个时频点的各声源出现概率;利用各声源出现概率计算噪声能量密度矩阵和目标声源导向矢量;计算波束形成系数;利用短时傅里叶频谱、各声源出现概率和波束形成系数,还原各声源对应的增强后信号的频谱。 |
