一种语音识别模型的训练方法和装置

基本信息

申请号 CN201810433323.8 申请日 -
公开(公告)号 CN108831441A 公开(公告)日 2018-11-16
申请公布号 CN108831441A 申请公布日 2018-11-16
分类号 G10L15/06 分类 乐器;声学;
发明人 张卓 申请(专利权)人 上海依图智安人工智能科技有限公司
代理机构 北京同达信恒知识产权代理有限公司 代理人 上海依图网络科技有限公司;上海图智安网络科技有限公司;深圳依图信息技术有限公司;上海依图信息技术有限公司
地址 200233 上海市徐汇区宜州路180号1幢第1层01、02室
法律状态 -

摘要

摘要 本申请实施例涉及人工智能领域,尤其涉及一种语音识别模型的训练方法和装置。本申请实施例提供一种语音识别模型的训练方法,包括:向语音识别模型输入语音,从语音识别模型的输出侧得到语音对应的N个文本,将N个文本中的每个文本与预设数据库中存储的多个文本进行匹配,得到N个文本对应的N个匹配程度值,根据N个匹配程度值和预设条件,将N个匹配程度值中的满足预设条件的匹配程度值对应的文本确定为目标文本,将语音和目标文本作为语音识别模型的训练数据,对语音识别模型进行训练。由于可以直接通过由语音识别模型得到的N个文本进行删选处理,确定出目标文本,不再需要人工标注得到就可以获取目标文本,如此可以节省人工成本。