一种英语口语发音自动纠正方法和装置
基本信息
申请号 | CN202110139760.0 | 申请日 | - |
公开(公告)号 | CN112466279B | 公开(公告)日 | 2021-05-18 |
申请公布号 | CN112466279B | 申请公布日 | 2021-05-18 |
分类号 | G10L15/00;G10L15/06;G10L15/08;G10L15/14;G10L15/16;G10L13/04;G10L25/03 | 分类 | 乐器;声学; |
发明人 | 王志彬 | 申请(专利权)人 | 深圳市阿卡索资讯股份有限公司 |
代理机构 | 深圳市智胜联合知识产权代理有限公司 | 代理人 | 齐文剑 |
地址 | 518000 广东省深圳市罗湖区笋岗街道笋西社区桃园路260号HALO广场四期九层 | ||
法律状态 | - |
摘要
摘要 | 本发明实施例提供了一种英语口语发音自动纠正方法和装置,将采集到的音频文件转化成数字信号,并进行降噪处理和特征提取,得到反映语音信号特征的关键特征参数,利用预训练的声学模型、语言模型及所有英文单词和短语组成的字典语料库建立识别网络,在所述识别网络中搜索与所述特征矢量序列匹配度最高的词串,将用法有误的单词和/或短语提取,利用语法和时态算法规则进行修正,采用所述声学模型生成对应的特征向量,并从预设语音素材库中匹配与其对应的语音素材,利用所述语音素材和所述特征向量反编码得到目标音频文件。反映语音信号特征的关键特征参数能够直接获得音素序列,提高语音识别度,能帮助语音合成更准确的音频,提高人声相似度。 |
