一种语音转换后文本纠错方法

基本信息

申请号 CN202010947098.7 申请日 -
公开(公告)号 CN112084775B 公开(公告)日 2021-09-07
申请公布号 CN112084775B 申请公布日 2021-09-07
分类号 G06F40/284;G06F40/30;G06F16/33;G06K9/62;G10L15/02;G10L15/14;G10L15/26;G10L25/24 分类 计算;推算;计数;
发明人 徐涵;许召辉;马翼平;陈年生;范光宇;饶蕾;章弘凯 申请(专利权)人 中航华东光电(上海)有限公司
代理机构 上海乐泓专利代理事务所(普通合伙) 代理人 张雪
地址 201114 上海市闵行区新骏环路115号1号楼3层
法律状态 -

摘要

摘要 本发明的一种语音转换后文本纠错方法,包括如下步骤:S100、输入语音信息,输出特征向量;S200、将特征向量输入到HMM声学模型,输出得到音素信息;S300、进行逐音扫描后与网络词库T1进行匹配,如果匹配成功,则输出文本,如果匹配失败,则与标准词库T2进行匹配;S400、将各个词与词库T2进行匹配,如果匹配成功,则输出文本结果,如果匹配失败,则继续步骤S500;S500、对匹配失败的词进行读音判断,对词进行逐字扫描和近似音转换;S600、将转换后的词重新进行步骤S300和S400。在语音识别文本匹配过程中,将匹配失败的词语进行读音替换,组成新词,来纠正由于口音造成的语音识别文本转换错误。