一种音色克隆方法、系统、装置及计算机可读存储介质专利查询专利号|摘要-满商公司网

请输入想查询的关键字

查询

退出

头部vip图标

浏览历史

清除

首页/ 杭州一知智能科技有限公司/ 专利详情

一种音色克隆方法、系统、装置及计算机可读存储介质

基本信息

申请号	CN202110408975.8	申请日	-
公开（公告）号	CN112992162B	公开（公告）日	2021-08-20
申请公布号	CN112992162B	申请公布日	2021-08-20
分类号	G10L19/16（2013.01）I;G10L25/30（2013.01）I	分类	乐器；声学;
发明人	黄一鸣;李一夫;陈哲乾	申请（专利权）人	杭州一知智能科技有限公司
代理机构	杭州智财黑马知识产权代理事务所（普通合伙）	代理人	张勇
地址	311215浙江省杭州市萧山区萧山经济技术开发区启迪路198号F座7层
法律状态	-

摘要

摘要	本发明公开了一种音色克隆方法、系统、装置及计算机可读存储介质，方法包括以下步骤：制作多说话人数据集并处理；训练对齐模型；制作目标说话人数据集并处理；训练多说话人语音合成模型；训练多说话人声码器模型；获取具有目标说话人音色的目标人语音合成模型；将待合成文本输入至目标人语音合成模型完成语音合成。本发明的有益效果是：目标说话人的风格和音色能够被更好的学习；可以通过指定韵律标签的方式来指定韵律节奏；使用时长预测模型来进行发音序列与频谱序列的对齐，加快语音生成的推理速度；在解码阶段添加音高和能量的预测和编码，目标人语音合成模型添加了音高和能量的预测与编码，有效的提高语音合成的效果。