一种英语口语发音自动纠正方法和装置

基本信息

申请号 CN202110139760.0 申请日 -
公开(公告)号 CN112466279B 公开(公告)日 2021-05-18
申请公布号 CN112466279B 申请公布日 2021-05-18
分类号 G10L15/00;G10L15/06;G10L15/08;G10L15/14;G10L15/16;G10L13/04;G10L25/03 分类 乐器;声学;
发明人 王志彬 申请(专利权)人 深圳市阿卡索资讯股份有限公司
代理机构 深圳市智胜联合知识产权代理有限公司 代理人 齐文剑
地址 518000 广东省深圳市罗湖区笋岗街道笋西社区桃园路260号HALO广场四期九层
法律状态 -

摘要

摘要 本发明实施例提供了一种英语口语发音自动纠正方法和装置,将采集到的音频文件转化成数字信号,并进行降噪处理和特征提取,得到反映语音信号特征的关键特征参数,利用预训练的声学模型、语言模型及所有英文单词和短语组成的字典语料库建立识别网络,在所述识别网络中搜索与所述特征矢量序列匹配度最高的词串,将用法有误的单词和/或短语提取,利用语法和时态算法规则进行修正,采用所述声学模型生成对应的特征向量,并从预设语音素材库中匹配与其对应的语音素材,利用所述语音素材和所述特征向量反编码得到目标音频文件。反映语音信号特征的关键特征参数能够直接获得音素序列,提高语音识别度,能帮助语音合成更准确的音频,提高人声相似度。