语音识别文本的纠错方法
基本信息

| 申请号 | CN202110357882.7 | 申请日 | - |
| 公开(公告)号 | CN113205813A | 公开(公告)日 | 2021-08-03 |
| 申请公布号 | CN113205813A | 申请公布日 | 2021-08-03 |
| 分类号 | G10L15/26(2006.01)I;G10L15/06(2013.01)I | 分类 | 乐器;声学; |
| 发明人 | 沈来信;穆瑞斌;贾师惠;孙明东;董军华 | 申请(专利权)人 | 北京华宇信息技术有限公司 |
| 代理机构 | 北京中索知识产权代理有限公司 | 代理人 | 胡大成 |
| 地址 | 100084北京市海淀区中关村东路1号院8号楼21层C2301、C2302 | ||
| 法律状态 | - | ||
摘要

| 摘要 | 本申请公开了一种语音识别文本的纠错方法。所述方法,包括:获取语音解码输出的待处理文本;调用检错模型处理所述待处理文本,得到出错目标字和出错目标字对应的置信度TopK候选字集;根据所述出错目标字和所述置信度TopK候选字集,对所述待处理文本进行纠错,得到第一纠错结果;根据名词处理模型和所述第一纠错结果,得到出错目标词、目标词类别和名词集合数据;根据所述出错目标词、所述目标词类别和所述名词集合数据,处理所述第一纠错结果,得到第二纠错结果;输出所述第二纠错结果,得到纠错后的最终文本;其中,K为正整数。通过用语言模型对语音解码输出的待处理文本进行处理,能够更好实现对语音识别文本的纠错。 |





