语音识别文本的纠错方法

基本信息

申请号 CN202110357882.7 申请日 -
公开(公告)号 CN113205813A 公开(公告)日 2021-08-03
申请公布号 CN113205813A 申请公布日 2021-08-03
分类号 G10L15/26(2006.01)I;G10L15/06(2013.01)I 分类 乐器;声学;
发明人 沈来信;穆瑞斌;贾师惠;孙明东;董军华 申请(专利权)人 北京华宇信息技术有限公司
代理机构 北京中索知识产权代理有限公司 代理人 胡大成
地址 100084北京市海淀区中关村东路1号院8号楼21层C2301、C2302
法律状态 -

摘要

摘要 本申请公开了一种语音识别文本的纠错方法。所述方法,包括:获取语音解码输出的待处理文本;调用检错模型处理所述待处理文本,得到出错目标字和出错目标字对应的置信度TopK候选字集;根据所述出错目标字和所述置信度TopK候选字集,对所述待处理文本进行纠错,得到第一纠错结果;根据名词处理模型和所述第一纠错结果,得到出错目标词、目标词类别和名词集合数据;根据所述出错目标词、所述目标词类别和所述名词集合数据,处理所述第一纠错结果,得到第二纠错结果;输出所述第二纠错结果,得到纠错后的最终文本;其中,K为正整数。通过用语言模型对语音解码输出的待处理文本进行处理,能够更好实现对语音识别文本的纠错。