一种英语口音识别系统

基本信息

申请号 CN201811371012.X 申请日 -
公开(公告)号 CN109493846B 公开(公告)日 2021-06-08
申请公布号 CN109493846B 申请公布日 2021-06-08
分类号 G10L15/00;G10L15/02;G10L15/04;G10L15/06;G10L15/16;G10L15/26 分类 乐器;声学;
发明人 钟建生;杨智;高聪;蒋秋燕;李坤 申请(专利权)人 深圳市声希科技有限公司
代理机构 深圳市正德知识产权代理事务所(特殊普通合伙) 代理人 周善勇
地址 518000 广东省深圳市宝安区新安街道兴东社区留仙大道2号汇聚创新园1栋314A
法律状态 -

摘要

摘要 本发明公开了一种英语口音识别系统,包括如下步骤,S1:训练多任务多口音模型;S2:识别模块对音频做口音识别;步骤S1完成对口音模型数据库的建立、模型目标函数的建立,以及函数数据的后续处理;步骤S2完成对数据语音信息的处理,先完成单个文本单词的处理,提取单词的美式音素序列和英式音素序列,然后针对整段文本音频进行处理,获取音频特征,最后根据S1中的多任务多口音模型获得音素的后验概率,求出每个单词发音的概率,最后将概率转化,进一步求出整个文本英式/美式发音的概率;本发明能够完成英文文本阅读语音的英式、美式发音的检测,并通过概率的方式呈现出来,便于用户了解,进一步的改进。