基于端到端模型的混合语音识别系统及方法

基本信息

申请号 CN202111041405.6 申请日 -
公开(公告)号 CN113763939A 公开(公告)日 2021-12-07
申请公布号 CN113763939A 申请公布日 2021-12-07
分类号 G10L15/183(2013.01)I;G10L15/06(2013.01)I;G10L15/02(2006.01)I 分类 乐器;声学;
发明人 司玉景;李全忠;何国涛;蒲瑶 申请(专利权)人 普强时代(珠海横琴)信息技术有限公司
代理机构 北京科亿知识产权代理事务所(普通合伙) 代理人 汤东凤
地址 519000广东省珠海市横琴新区宝华路6号105室-58115(集中办公区)
法律状态 -

摘要

摘要 本发明涉及一种基于端到端模型的混合语音识别系统及方法,包括特征提取模块、语言模型、基于端到端模型的声学模型、解码器、词图重估模块以及输出模块。本发明采用声学语言端到端建模技术,对海量语音数据进行建模,并将端到端模型的编码网络作为声学模型,嵌入到混合语音识别系统中,不仅进一步提高了语音识别准确率,而且解决了纯端到端语音识别系统在项目中难以做定制化的问题。另外,本发明在端到端模型的编码网络的基础上,继续做鉴别性声学模型训练(SMBR、MPE等),可以进一步提高识别准确率。