一种语音识别文本的质量提升方法和装置

基本信息

申请号 CN201910739528.3 申请日 -
公开(公告)号 CN112447172A 公开(公告)日 2021-03-05
申请公布号 CN112447172A 申请公布日 2021-03-05
分类号 G10L15/06(2013.01)I;G10L15/26(2006.01)I;G06F40/211(2020.01)I;G06N3/04(2006.01)I;G10L15/22(2006.01)I;G10L25/30(2013.01)I 分类 乐器;声学;
发明人 葛懿;赵维峥;郑黎;吴泽 申请(专利权)人 云号(北京)科技有限公司
代理机构 北京德琦知识产权代理有限公司 代理人 张驰;宋志强
地址 100088北京市西城区新街口外大街28号院C座C208
法律状态 -

摘要

摘要 本发明实施方式公开了一种语音识别文本的质量提升方法和装置。该方法包括:获取语音识别文本,将所述语音识别文本平行输入N‑gram检错模型和长短期记忆(LSTM)检错模型;使能N‑gram检错模型对所述语音识别文本检错以确定第一错误词语,使能LSTM检错模型对所述语音识别文本检错以确定第二错误词语;融合N‑gram检错模型输出的第一错误词语和LSTM检错模型输出的第二错误词语,以获取融合后错误词语;基于依存句法分析方式对所述融合后错误词语执行纠错。引入了上下文信息,扩展了检错范围,提高了检错精度。