一种端到端的口音转换方法

基本信息

申请号 CN202010239586.2 申请日 -
公开(公告)号 CN111462769A 公开(公告)日 2020-07-28
申请公布号 CN111462769A 申请公布日 2020-07-28
分类号 G10L21/013(2013.01)I 分类 -
发明人 刘颂湘;王迪松;曹悦雯;孙立发;吴锡欣;康世胤;吴志勇;刘循英;蒙美玲 申请(专利权)人 深圳市声希科技有限公司
代理机构 北京联瑞联丰知识产权代理事务所(普通合伙) 代理人 深圳市声希科技有限公司
地址 518101广东省深圳市宝安区新安街道兴东社区留仙大道2号汇聚创新园2栋2710
法律状态 -

摘要

摘要 本发明公开了一种端到端的口音转换方法,将非地道口音转换为地道口音,属于语音处理技术领域,也可用于将发音障碍的患者的语音转换为标准语音,包括实现口音转换方法的口音转换系统,口音转换系统包括语音识别模块、说话人编码器、语音合成模块、神经网络声码器,语音识别模块用于将输入的非地道口音的声学特征调整为地道口音的信号参数,信号参数仅与非地道口音的说话内容相关;非地道口音的信号参数和说话人向量输入至语音合成模块,经语音合成模块处理过的语音最后通过神经网络声码器即可合成特定说话人的地道口音;有益效果是:在转换过程中无需地道口音参考音频的任何指导,即能够将非地道口音转换为地道口音,并且保持说话人的原本音色。