基于小样本的语音实时克隆的方法、装置、设备和介质
基本信息
申请号 | CN202010397517.4 | 申请日 | - |
公开(公告)号 | CN111681635A | 公开(公告)日 | 2020-09-18 |
申请公布号 | CN111681635A | 申请公布日 | 2020-09-18 |
分类号 | G10L13/02(2013.01)I | 分类 | 乐器;声学; |
发明人 | 黄立;陈钦梁;刘琨 | 申请(专利权)人 | 深圳市镜象科技有限公司 |
代理机构 | 深圳中细软知识产权代理有限公司 | 代理人 | 深圳市镜象科技有限公司 |
地址 | 518000广东省深圳市南山区中科纳能研发中心C座 | ||
法律状态 | - |
摘要
摘要 | 本发明实施例公开了一种基于小样本的语音实时克隆的方法,该方法包括:获取待克隆语音,将待克隆语音输入说话人特征提取器进行特征提取,得到目标说话人特征;获取待克隆文字文本,将待克隆文字文本输入拼音转换器进行拼音转换,得到待克隆拼音文本;将目标说话人特征与待克隆拼音文本输入合成器进行克隆合成,将合成器的输出输入声音解码器进行解码,得到目标克隆语音。由于待克隆拼音文本中每一拼音都对应唯一确定的发音,因此本发明能提高克隆语音的准确率,也就提高了克隆语音的克隆质量。此外,还提出了基于小样本的语音实时克隆的装置、计算机设备和存储介质。 |
