针对目标说话人提取的单通道语音分离方法及系统

基本信息

申请号 CN202011057722.2 申请日 -
公开(公告)号 CN111899757B 公开(公告)日 2021-01-12
申请公布号 CN111899757B 申请公布日 2021-01-12
分类号 G10L21/0272;G10L21/028;G10L25/30 分类 乐器;声学;
发明人 史慧宇;欧阳鹏 申请(专利权)人 南京蕴智科技有限公司
代理机构 北京索睿邦知识产权代理有限公司 代理人 李根
地址 211100 江苏省南京市江宁区麒麟科技创新园创研路266号人工智能产业园8号楼4楼
法律状态 -

摘要

摘要 本发明提供了针对目标说话人提取的单通道语音分离方法,包括:获取目标说话人混合语音样本。根据初始化后的初始深度神经网络模型参数,训练初始深度神经网络模型获取第一深度神经网络模型。生成第二深度神经网络模型。初始化第二深度神经网络模型。获取当前深度神经网络模型。根据估计掩蔽及目标说话人混合语音样本的音频获取目标说话人语音样本。本发明中的针对目标说话人提取的单通道语音分离方法比现有的目标说话人提取单通道语音分离方法能在提高分离准确度、说话可懂度的同时,缩小算法的网络模型尺寸,减少计算内存,增强算法落地实现的有效性。同时,本发明还提供了针对目标说话人提取的单通道语音分离系统。