一种语音数据的识别方法及装置

基本信息

申请号 CN202011578798.X 申请日 -
公开(公告)号 CN112786051A 公开(公告)日 2021-05-11
申请公布号 CN112786051A 申请公布日 2021-05-11
分类号 G10L15/26;G10L15/18 分类 乐器;声学;
发明人 杨超;陈晓宇;张彬彬;曾晨晨 申请(专利权)人 出门问问(苏州)信息科技有限公司
代理机构 北京乐知新创知识产权代理事务所(普通合伙) 代理人 刘婧
地址 215000 江苏省苏州市苏州工业园区星湖街328号创意产业园4-B404单元
法律状态 -

摘要

摘要 本发明公开一种语音数据的识别方法及装置,该方法包括:采集第一语音训练集,根据第一语音训练集得到一级语音识别模型;采集第一语音评估集,对应第一文本数据集;对第一语音评估集分别从预设的多个维度进行变换处理,得到多个语音评估集;使用一级语音识别模型分别对多个语音评估集进行识别,得到多个文本数据集;将多个文本数据集与第一文本数据集进行比对,得到多个语音文本识别错误率;根据多个语音文本识别错误率确定使用对应维度对第一语音训练集进行变换处理的占比;根据多个占比对第一语音训练集中相应数量的语音样本数据进行变换处理得到第二语音训练集;使用第二语音训练集对所述一级语音识别模型进行训练,得到二级语音识别模型。