一种基于混合式概率模型的多通道声源分离方法

基本信息

申请号 CN201911257725.8 申请日 -
公开(公告)号 CN112951264A 公开(公告)日 2021-06-11
申请公布号 CN112951264A 申请公布日 2021-06-11
分类号 G10L21/0272;G10L21/0232;G10L21/0216;G06N3/04;G06N3/08;G06K9/62 分类 乐器;声学;
发明人 张鹏远;陈航艇;颜永红 申请(专利权)人 北京中科信利技术有限公司
代理机构 北京方安思达知识产权代理有限公司 代理人 陈琳琳;杨青
地址 100190 北京市海淀区北四环西路21号
法律状态 -

摘要

摘要 本发明公开了一种基于混合式概率模型的多通道声源分离方法,所述方法包括:计算待分离的多声源信号的短时傅里叶频谱,基于预先建立的深度聚类网络提取每个时频点的声源嵌入向量;将声源嵌入向量输入混合式概率模型,利用期望最大化算法迭代混合式概率模型,模型收敛后输出每个时频点的各声源出现概率;利用各声源出现概率计算噪声能量密度矩阵和目标声源导向矢量;计算波束形成系数;利用短时傅里叶频谱、各声源出现概率和波束形成系数,还原各声源对应的增强后信号的频谱。