一种实时变声的方法、装置及电子设备
基本信息
申请号 | CN202110463732.4 | 申请日 | - |
公开(公告)号 | CN113362807A | 公开(公告)日 | 2021-09-07 |
申请公布号 | CN113362807A | 申请公布日 | 2021-09-07 |
分类号 | G10L15/02;G10L15/06;G10L15/22;G10L19/16;G10L21/013 | 分类 | 乐器;声学; |
发明人 | 戈文硕;刘恺;陈伟 | 申请(专利权)人 | 北京搜狗智能科技有限公司 |
代理机构 | 北京华沛德权律师事务所 | 代理人 | 房德权 |
地址 | 100084 北京市海淀区中关村东路1号院9号楼8层802 | ||
法律状态 | - |
摘要
摘要 | 本发明公开了一种实时变声的方法,获取源说话人的原语音数据;通过语音识别模型提取原始音频识别特征;将所述原始音频识别特征输入到目标变声模型中,输出所述目标说话人的声学特征;将所述目标说话人的声学特征以所述目标语音进行输出。上述技术方案中,由于语音识别模型的参数量小于第一设定参数量,且目标变声模型的参数量小于第二设定参数量,使得语音识别模型和目标变声模型均为小模型,且采用了流式调度特征提取,如此,能够极大的缩减计算量,从而能够实现低响应延迟的实时变声的效果。 |
