一种催收场景下语音识别结果的纠错方法

基本信息

申请号 CN202010089898.X 申请日 -
公开(公告)号 CN111339757A 公开(公告)日 2020-06-26
申请公布号 CN111339757A 申请公布日 2020-06-26
分类号 G06F40/232(2020.01)I 分类 -
发明人 鲁进 申请(专利权)人 上海凯岸信息科技有限公司
代理机构 上海海贝律师事务所 代理人 上海凯岸信息科技有限公司
地址 201808上海市嘉定区嘉罗公路1661弄12号101室-16
法律状态 -

摘要

摘要 本发明公开了一种催收场景下语音识别结果的纠错方法,包括如下步骤:步骤1,催收领域专有词典库生成,步骤2,训练催收领域的催收员与客户通话之间语料的HMM模型:利用催收领域催收员与客户通话语料,并进行一定的人工标注整理后,作为训练样本,计算出初始发射概率、转移概率、发射概率,步骤3,待纠错文本生成,步骤4,纠错后文本集生成方法,步骤5,纠错后文本筛选方法:首先将确定的候选待纠错文本替换为对应的候选纠错后文本集合,利用训练出的HMM模型,结合算法进行解码工作,计算出最终候选纠错后文本。本发明,能够很好的对催收员的语音识别后进行纠正,很好的方便该语音识别产品大规模产品化应用。