构建压缩的语音识别模型的方法

基本信息

申请号 CN202010414344.2 申请日 -
公开(公告)号 CN111627428A 公开(公告)日 2020-09-04
申请公布号 CN111627428A 申请公布日 2020-09-04
分类号 G10L15/06(2013.01)I 分类 乐器;声学;
发明人 刘利平;夏春晖 申请(专利权)人 北京青牛技术股份有限公司
代理机构 北京元合联合知识产权代理事务所(特殊普通合伙) 代理人 北京青牛技术股份有限公司
地址 100000北京市石景山区田顺庄北路1号院3号楼9层901室
法律状态 -

摘要

摘要 本发明提供了一种构建压缩的语音识别模型的方法,该方法包括:采集音频数据;提供经过训练的教师模型,将所述音频数据输入至所述教师模型,获得所述教师模型针对所述音频数据输出的软化概率分布向量;提供经过初始化的学生模型,将所述音频数据作为输入,以及将所述软化概率分布向量作为监督信号,训练所述学生模型;对训练后的学生模型进行压缩处理;利用根据所述音频数据对应的转录文本生成的语言模型对压缩处理后的学生模型进行超参数优化处理,以获得压缩的语音识别模型。此外,本发明还提供相应的计算机介质。