基于端到端模型的混合语音识别系统及方法
基本信息

| 申请号 | CN202111041405.6 | 申请日 | - |
| 公开(公告)号 | CN113763939A | 公开(公告)日 | 2021-12-07 |
| 申请公布号 | CN113763939A | 申请公布日 | 2021-12-07 |
| 分类号 | G10L15/183(2013.01)I;G10L15/06(2013.01)I;G10L15/02(2006.01)I | 分类 | 乐器;声学; |
| 发明人 | 司玉景;李全忠;何国涛;蒲瑶 | 申请(专利权)人 | 普强时代(珠海横琴)信息技术有限公司 |
| 代理机构 | 北京科亿知识产权代理事务所(普通合伙) | 代理人 | 汤东凤 |
| 地址 | 519000广东省珠海市横琴新区宝华路6号105室-58115(集中办公区) | ||
| 法律状态 | - | ||
摘要

| 摘要 | 本发明涉及一种基于端到端模型的混合语音识别系统及方法,包括特征提取模块、语言模型、基于端到端模型的声学模型、解码器、词图重估模块以及输出模块。本发明采用声学语言端到端建模技术,对海量语音数据进行建模,并将端到端模型的编码网络作为声学模型,嵌入到混合语音识别系统中,不仅进一步提高了语音识别准确率,而且解决了纯端到端语音识别系统在项目中难以做定制化的问题。另外,本发明在端到端模型的编码网络的基础上,继续做鉴别性声学模型训练(SMBR、MPE等),可以进一步提高识别准确率。 |





