基于小样本的语音实时克隆的方法、装置、设备和介质

基本信息

申请号 CN202010397517.4 申请日 -
公开(公告)号 CN111681635A 公开(公告)日 2020-09-18
申请公布号 CN111681635A 申请公布日 2020-09-18
分类号 G10L13/02(2013.01)I 分类 乐器;声学;
发明人 黄立;陈钦梁;刘琨 申请(专利权)人 深圳市镜象科技有限公司
代理机构 深圳中细软知识产权代理有限公司 代理人 深圳市镜象科技有限公司
地址 518000广东省深圳市南山区中科纳能研发中心C座
法律状态 -

摘要

摘要 本发明实施例公开了一种基于小样本的语音实时克隆的方法,该方法包括:获取待克隆语音,将待克隆语音输入说话人特征提取器进行特征提取,得到目标说话人特征;获取待克隆文字文本,将待克隆文字文本输入拼音转换器进行拼音转换,得到待克隆拼音文本;将目标说话人特征与待克隆拼音文本输入合成器进行克隆合成,将合成器的输出输入声音解码器进行解码,得到目标克隆语音。由于待克隆拼音文本中每一拼音都对应唯一确定的发音,因此本发明能提高克隆语音的准确率,也就提高了克隆语音的克隆质量。此外,还提出了基于小样本的语音实时克隆的装置、计算机设备和存储介质。