人声分离提取方法方法、装置、计算机设备及存储介质
基本信息
申请号 | CN202010792766.3 | 申请日 | - |
公开(公告)号 | CN111933172A | 公开(公告)日 | 2020-11-13 |
申请公布号 | CN111933172A | 申请公布日 | 2020-11-13 |
分类号 | G10L21/0272(2013.01)I | 分类 | 乐器;声学; |
发明人 | 刘嗣平;柯登峰;张思萱 | 申请(专利权)人 | 广州九四智能科技有限公司 |
代理机构 | 深圳科湾知识产权代理事务所(普通合伙) | 代理人 | 广州九四智能科技有限公司 |
地址 | 510665广东省广州市天河区车陂路113号1405室 | ||
法律状态 | - |
摘要
摘要 | 本申请实施例属于语音识别技术领域,涉及人声分离提取方法,包括一种人声分离提取方法,包括将带有环境噪声的录音转化为原始幅度谱;将所述原始幅度谱输入到预先训练的抗噪神经网络,以确定与所述原始幅度谱相应的p‑PSM值,所述p‑PSM值大于等于0;将所述原始幅度频谱与对应的p‑PSM点乘,以获取去噪幅度谱;将所述去噪幅度谱输入到预先训练的谐波恢复神经网络,以恢复所述去噪幅度频谱,并获取所述去噪幅度频谱对应的纯净幅度频谱;将所述纯净幅度频谱转换为语音。本申请还提供一种人声分离提取装置、计算机设备及存储介质。本申请能够避除噪声规避过程中语音的损失,人声提取更为准确。 |
