人声分离提取方法方法、装置、计算机设备及存储介质

基本信息

申请号 CN202010792766.3 申请日 -
公开(公告)号 CN111933172A 公开(公告)日 2020-11-13
申请公布号 CN111933172A 申请公布日 2020-11-13
分类号 G10L21/0272(2013.01)I 分类 乐器;声学;
发明人 刘嗣平;柯登峰;张思萱 申请(专利权)人 广州九四智能科技有限公司
代理机构 深圳科湾知识产权代理事务所(普通合伙) 代理人 广州九四智能科技有限公司
地址 510665广东省广州市天河区车陂路113号1405室
法律状态 -

摘要

摘要 本申请实施例属于语音识别技术领域,涉及人声分离提取方法,包括一种人声分离提取方法,包括将带有环境噪声的录音转化为原始幅度谱;将所述原始幅度谱输入到预先训练的抗噪神经网络,以确定与所述原始幅度谱相应的p‑PSM值,所述p‑PSM值大于等于0;将所述原始幅度频谱与对应的p‑PSM点乘,以获取去噪幅度谱;将所述去噪幅度谱输入到预先训练的谐波恢复神经网络,以恢复所述去噪幅度频谱,并获取所述去噪幅度频谱对应的纯净幅度频谱;将所述纯净幅度频谱转换为语音。本申请还提供一种人声分离提取装置、计算机设备及存储介质。本申请能够避除噪声规避过程中语音的损失,人声提取更为准确。