一种语音识别文本的质量提升方法和装置
基本信息
申请号 | CN201910739528.3 | 申请日 | - |
公开(公告)号 | CN112447172A | 公开(公告)日 | 2021-03-05 |
申请公布号 | CN112447172A | 申请公布日 | 2021-03-05 |
分类号 | G10L15/06(2013.01)I;G10L15/26(2006.01)I;G06F40/211(2020.01)I;G06N3/04(2006.01)I;G10L15/22(2006.01)I;G10L25/30(2013.01)I | 分类 | 乐器;声学; |
发明人 | 葛懿;赵维峥;郑黎;吴泽 | 申请(专利权)人 | 云号(北京)科技有限公司 |
代理机构 | 北京德琦知识产权代理有限公司 | 代理人 | 张驰;宋志强 |
地址 | 100088北京市西城区新街口外大街28号院C座C208 | ||
法律状态 | - |
摘要
摘要 | 本发明实施方式公开了一种语音识别文本的质量提升方法和装置。该方法包括:获取语音识别文本,将所述语音识别文本平行输入N‑gram检错模型和长短期记忆(LSTM)检错模型;使能N‑gram检错模型对所述语音识别文本检错以确定第一错误词语,使能LSTM检错模型对所述语音识别文本检错以确定第二错误词语;融合N‑gram检错模型输出的第一错误词语和LSTM检错模型输出的第二错误词语,以获取融合后错误词语;基于依存句法分析方式对所述融合后错误词语执行纠错。引入了上下文信息,扩展了检错范围,提高了检错精度。 |
