基于端到端深度学习模型的语音识别方法及系统

基本信息

申请号 CN201810739424.8 申请日 -
公开(公告)号 CN109147766B 公开(公告)日 2019-01-04
申请公布号 CN109147766B 申请公布日 2019-01-04
分类号 G10L15/06(2013.01)I;G06N20/00(2019.01)I 分类 -
发明人 赵明 申请(专利权)人 北京爱医声科技有限公司
代理机构 北京鸿元知识产权代理有限公司 代理人 北京爱医声科技有限公司
地址 100095北京市海淀区北清路164号17-27号院154号
法律状态 -

摘要

摘要 一种基于端到端深度学习模型的语音识别方法,包括以下步骤:把发音相近的韵母映射到同一个编码,把发音相近的声母映射到同一个编码,形成规则映射表;用规则映射表对语料进行数据编码,把语料的汉字利用规则映射表中编码进行表示;对编码后的语料使用混合式端到端模型训练,混合式端到端模型包括“拼音”端到端模型和“音素”端到端模型,得到“拼音”和“音素”声学模型;用规则映射表对将要应用的多个词汇进行编码,形成词汇库;使用声学模型识别语音;使用编辑距离对比声学模型输出的编码和词汇库内词汇的编码,找到最小编辑距离,对应的词汇就是识别结果。本方法提升了系统的识别效率。