一种英语口音识别系统
基本信息
申请号 | CN201811371012.X | 申请日 | - |
公开(公告)号 | CN109493846B | 公开(公告)日 | 2021-06-08 |
申请公布号 | CN109493846B | 申请公布日 | 2021-06-08 |
分类号 | G10L15/00;G10L15/02;G10L15/04;G10L15/06;G10L15/16;G10L15/26 | 分类 | 乐器;声学; |
发明人 | 钟建生;杨智;高聪;蒋秋燕;李坤 | 申请(专利权)人 | 深圳市声希科技有限公司 |
代理机构 | 深圳市正德知识产权代理事务所(特殊普通合伙) | 代理人 | 周善勇 |
地址 | 518000 广东省深圳市宝安区新安街道兴东社区留仙大道2号汇聚创新园1栋314A | ||
法律状态 | - |
摘要
摘要 | 本发明公开了一种英语口音识别系统,包括如下步骤,S1:训练多任务多口音模型;S2:识别模块对音频做口音识别;步骤S1完成对口音模型数据库的建立、模型目标函数的建立,以及函数数据的后续处理;步骤S2完成对数据语音信息的处理,先完成单个文本单词的处理,提取单词的美式音素序列和英式音素序列,然后针对整段文本音频进行处理,获取音频特征,最后根据S1中的多任务多口音模型获得音素的后验概率,求出每个单词发音的概率,最后将概率转化,进一步求出整个文本英式/美式发音的概率;本发明能够完成英文文本阅读语音的英式、美式发音的检测,并通过概率的方式呈现出来,便于用户了解,进一步的改进。 |
