特定领域的语音识别模型的构建方法
基本信息
申请号 | CN202010413228.9 | 申请日 | - |
公开(公告)号 | CN111627427A | 公开(公告)日 | 2020-09-04 |
申请公布号 | CN111627427A | 申请公布日 | 2020-09-04 |
分类号 | G10L15/06(2013.01)I;G10L15/01(2013.01)I | 分类 | 乐器;声学; |
发明人 | 刘利平;张欣;孔卫东 | 申请(专利权)人 | 北京青牛技术股份有限公司 |
代理机构 | 北京元合联合知识产权代理事务所(特殊普通合伙) | 代理人 | 北京青牛技术股份有限公司 |
地址 | 100000北京市石景山区田顺庄北路1号院3号楼9层901室 | ||
法律状态 | - |
摘要
摘要 | 本发明提供了一种特定领域的语音识别模型的构建方法,该方法包括:S1.将特定领域的音频数据进行文本转录,以构建所述音频数据及其对应的转录文本组成的训练集;S2.将所述训练集输入一现有的语音识别模型,对所述语音识别模型执行针对所述特定领域的迁移学习训练;S3.选择所述训练集的一个子集,将所述子集输入所述语音识别模型进行语音识别测试;S4.校准所述语音识别测试的输出结果,根据校准后的输出结果更新所述子集,将所述子集输入所述语音识别模型,对所述语音模型执行迭代训练;S5.利用根据所述训练集生成的语言模型,对所述语音识别模型进行超参数调整处理,获得特定领域的语音识别模型。此外,本发明还提供了相应的计算机介质。 |
