一种空间结构性特征相关的无监督分类与有监督修正融合的语音分离方法

基本信息

申请号 CN202010966976.X 申请日 -
公开(公告)号 CN112133323A 公开(公告)日 2020-12-25
申请公布号 CN112133323A 申请公布日 2020-12-25
分类号 G10L21/0272(2013.01)I 分类 乐器;声学;
发明人 赵振;刘扬;焦美凤;姜明顺;张雷;张法业;杜泽厚 申请(专利权)人 日照市人防智能科技有限公司
代理机构 青岛中天汇智知识产权代理有限公司 代理人 青岛科技大学;日照市人防智能科技有限公司
地址 266000山东省青岛市崂山区松岭路99号
法律状态 -

摘要

摘要 本发明公开一种空间结构性特征相关的无监督分类与有监督修正融合的语音分离方法,包括:基于时滞细胞神经网络的语音片段特征提取、基于动态增长自组织映射神经网络的语音片段无监督自适应分类;基于粒子群优化算法语音分离模型自适应修正和基于二值掩蔽的语音重构。本方案结合无监督分类和有监督修正,更有利于提高说话人数目未知的混合语音分离的泛化性和准确性,为单信道多说话人语音分离这样一个迫切需要解决的实际问题,提供一个理论支撑而且实际可行的方案。