一种热词获取方法、语音识别方法及相关设备

基本信息

申请号 CN202011571404.8 申请日 -
公开(公告)号 CN112735428A 公开(公告)日 2021-04-30
申请公布号 CN112735428A 申请公布日 2021-04-30
分类号 G10L15/26;G10L15/183;G06F40/284;G06F40/242;G06F40/232;G06F40/216;G06F40/211;G06F40/166 分类 乐器;声学;
发明人 朱菊霞;万根顺;高建清 申请(专利权)人 科大讯飞(上海)科技有限公司
代理机构 北京集佳知识产权代理有限公司 代理人 张柳
地址 200050 上海市长宁区广顺路33号8幢一层1966室
法律状态 -

摘要

摘要 本申请提供了一种热词获取方法、语音识别方法及相关设备,其中,热词获取方法包括:获取目标用户的历史文本数据;基于历史文本数据的编辑行为和/或历史文本数据所包含词的特征从历史文本数据中抽取候选热词,以得到候选热词集;基于候选热词集中每个候选热词的发音,采用模糊音匹配的方式获取候选热词集中每个候选热词对应的扩展词;根据候选热词集中每个候选热词对应的扩展词,从候选热词集中过滤掉非热词,以得到目标用户的热词集。经由上述方法可获得高质量热词,在进行语音识别时,辅以高质量热词,能够提升语音识别效果。