一种实时变声的方法、装置及电子设备

基本信息

申请号 CN202110463732.4 申请日 -
公开(公告)号 CN113362807A 公开(公告)日 2021-09-07
申请公布号 CN113362807A 申请公布日 2021-09-07
分类号 G10L15/02;G10L15/06;G10L15/22;G10L19/16;G10L21/013 分类 乐器;声学;
发明人 戈文硕;刘恺;陈伟 申请(专利权)人 北京搜狗智能科技有限公司
代理机构 北京华沛德权律师事务所 代理人 房德权
地址 100084 北京市海淀区中关村东路1号院9号楼8层802
法律状态 -

摘要

摘要 本发明公开了一种实时变声的方法,获取源说话人的原语音数据;通过语音识别模型提取原始音频识别特征;将所述原始音频识别特征输入到目标变声模型中,输出所述目标说话人的声学特征;将所述目标说话人的声学特征以所述目标语音进行输出。上述技术方案中,由于语音识别模型的参数量小于第一设定参数量,且目标变声模型的参数量小于第二设定参数量,使得语音识别模型和目标变声模型均为小模型,且采用了流式调度特征提取,如此,能够极大的缩减计算量,从而能够实现低响应延迟的实时变声的效果。