语音识别文本的纠错方法
基本信息
申请号 | CN202110357882.7 | 申请日 | - |
公开(公告)号 | CN113205813A | 公开(公告)日 | 2021-08-03 |
申请公布号 | CN113205813A | 申请公布日 | 2021-08-03 |
分类号 | G10L15/26(2006.01)I;G10L15/06(2013.01)I | 分类 | 乐器;声学; |
发明人 | 沈来信;穆瑞斌;贾师惠;孙明东;董军华 | 申请(专利权)人 | 北京华宇信息技术有限公司 |
代理机构 | 北京中索知识产权代理有限公司 | 代理人 | 胡大成 |
地址 | 100084北京市海淀区中关村东路1号院8号楼21层C2301、C2302 | ||
法律状态 | - |
摘要
摘要 | 本申请公开了一种语音识别文本的纠错方法。所述方法,包括:获取语音解码输出的待处理文本;调用检错模型处理所述待处理文本,得到出错目标字和出错目标字对应的置信度TopK候选字集;根据所述出错目标字和所述置信度TopK候选字集,对所述待处理文本进行纠错,得到第一纠错结果;根据名词处理模型和所述第一纠错结果,得到出错目标词、目标词类别和名词集合数据;根据所述出错目标词、所述目标词类别和所述名词集合数据,处理所述第一纠错结果,得到第二纠错结果;输出所述第二纠错结果,得到纠错后的最终文本;其中,K为正整数。通过用语言模型对语音解码输出的待处理文本进行处理,能够更好实现对语音识别文本的纠错。 |
