一种基于缓存语言模型的语音识别自适应方法和系统

基本信息

申请号 CN202011332443.2 申请日 -
公开(公告)号 CN112509560B 公开(公告)日 2021-09-03
申请公布号 CN112509560B 申请公布日 2021-09-03
分类号 G10L15/04;G10L15/183;G10L15/26 分类 乐器;声学;
发明人 黄俊杰 申请(专利权)人 杭州一知智能科技有限公司
代理机构 杭州求是专利事务所有限公司 代理人 郑海峰
地址 311200 浙江省杭州市萧山区启迪路198号杭州湾信息港F座7楼
法律状态 -

摘要

摘要 本发明公开了一种基于缓存语言模型的语音识别自适应方法和系统,属于语音识别领域。本发明通过接收用户输入的持续语音信号,基于语音活动检测技术VAD将持续语音信号切分为多个短语音,基于通用语言模型对短语音依次进行识别,并为每个短语音生成对应的识别结果,基于关键词搜索得到关联词表,通过缓存模型对关联词表进行处理,得到适应历史识别文本分布的局部变化的语言模型,基于修改后的语言模型对后续短语音继续识别。经过局部修改后,语言模型和历史识别内容具有更好的相似性,提升了持续长语音的识别的准确率。另外,用户可以在识别的过程中对错误识别的低频词进行主动修正,提升后续对低频词的识别准确率。