特定领域的语音识别模型的构建方法

基本信息

申请号 CN202010413228.9 申请日 -
公开(公告)号 CN111627427A 公开(公告)日 2020-09-04
申请公布号 CN111627427A 申请公布日 2020-09-04
分类号 G10L15/06(2013.01)I;G10L15/01(2013.01)I 分类 乐器;声学;
发明人 刘利平;张欣;孔卫东 申请(专利权)人 北京青牛技术股份有限公司
代理机构 北京元合联合知识产权代理事务所(特殊普通合伙) 代理人 北京青牛技术股份有限公司
地址 100000北京市石景山区田顺庄北路1号院3号楼9层901室
法律状态 -

摘要

摘要 本发明提供了一种特定领域的语音识别模型的构建方法,该方法包括:S1.将特定领域的音频数据进行文本转录,以构建所述音频数据及其对应的转录文本组成的训练集;S2.将所述训练集输入一现有的语音识别模型,对所述语音识别模型执行针对所述特定领域的迁移学习训练;S3.选择所述训练集的一个子集,将所述子集输入所述语音识别模型进行语音识别测试;S4.校准所述语音识别测试的输出结果,根据校准后的输出结果更新所述子集,将所述子集输入所述语音识别模型,对所述语音模型执行迭代训练;S5.利用根据所述训练集生成的语言模型,对所述语音识别模型进行超参数调整处理,获得特定领域的语音识别模型。此外,本发明还提供了相应的计算机介质。