特定领域的语音识别模型的构建方法专利查询专利号|摘要-满商公司网

特定领域的语音识别模型的构建方法

基本信息

申请号	CN202010413228.9	申请日	-
公开（公告）号	CN111627427A	公开（公告）日	2020-09-04
申请公布号	CN111627427A	申请公布日	2020-09-04
分类号	G10L15/06(2013.01)I;G10L15/01(2013.01)I	分类	乐器；声学;
发明人	刘利平;张欣;孔卫东	申请（专利权）人	北京青牛技术股份有限公司
代理机构	北京元合联合知识产权代理事务所（特殊普通合伙）	代理人	北京青牛技术股份有限公司
地址	100000北京市石景山区田顺庄北路1号院3号楼9层901室
法律状态	-

摘要

本发明提供了一种特定领域的语音识别模型的构建方法，该方法包括：S1.将特定领域的音频数据进行文本转录，以构建所述音频数据及其对应的转录文本组成的训练集；S2.将所述训练集输入一现有的语音识别模型，对所述语音识别模型执行针对所述特定领域的迁移学习训练；S3.选择所述训练集的一个子集，将所述子集输入所述语音识别模型进行语音识别测试；S4.校准所述语音识别测试的输出结果，根据校准后的输出结果更新所述子集，将所述子集输入所述语音识别模型，对所述语音模型执行迭代训练；S5.利用根据所述训练集生成的语言模型，对所述语音识别模型进行超参数调整处理，获得特定领域的语音识别模型。此外，本发明还提供了相应的计算机介质。