基于端到端深度学习模型的语音识别方法及系统
基本信息
申请号 | CN201810739424.8 | 申请日 | - |
公开(公告)号 | CN109147766B | 公开(公告)日 | 2019-01-04 |
申请公布号 | CN109147766B | 申请公布日 | 2019-01-04 |
分类号 | G10L15/06(2013.01)I;G06N20/00(2019.01)I | 分类 | - |
发明人 | 赵明 | 申请(专利权)人 | 北京爱医声科技有限公司 |
代理机构 | 北京鸿元知识产权代理有限公司 | 代理人 | 北京爱医声科技有限公司 |
地址 | 100095北京市海淀区北清路164号17-27号院154号 | ||
法律状态 | - |
摘要
摘要 | 一种基于端到端深度学习模型的语音识别方法,包括以下步骤:把发音相近的韵母映射到同一个编码,把发音相近的声母映射到同一个编码,形成规则映射表;用规则映射表对语料进行数据编码,把语料的汉字利用规则映射表中编码进行表示;对编码后的语料使用混合式端到端模型训练,混合式端到端模型包括“拼音”端到端模型和“音素”端到端模型,得到“拼音”和“音素”声学模型;用规则映射表对将要应用的多个词汇进行编码,形成词汇库;使用声学模型识别语音;使用编辑距离对比声学模型输出的编码和词汇库内词汇的编码,找到最小编辑距离,对应的词汇就是识别结果。本方法提升了系统的识别效率。 |
