一种语种识别模型构建方法、语种识别方法

基本信息

申请号 CN202110770019.4 申请日 -
公开(公告)号 CN113488023A 公开(公告)日 2021-10-08
申请公布号 CN113488023A 申请公布日 2021-10-08
分类号 G10L15/00(2013.01)I;G10L15/06(2013.01)I 分类 乐器;声学;
发明人 杨军;方磊 申请(专利权)人 合肥讯飞数码科技有限公司
代理机构 北京集佳知识产权代理有限公司 代理人 郭化雨
地址 230088安徽省合肥市高新区望江西路666号人工智能云服务平台研发楼
法律状态 -

摘要

摘要 本申请公开了一种语种识别模型构建方法、语种识别方法,先利用第一样本语音及其实际语种、第二样本语音,针对待训练教师模型和待训练学生模型进行两阶段训练,得到待使用教师模型和待使用学生模型,以使该待使用教师模型和该待使用学生模型均具有较好的语种识别性能;再根据该待使用学生模型确定语种识别模型,以使该语种识别模型也具有较好的语种识别性能;最后,借助该语种识别模型针对待识别语音进行语种识别,得到该待识别语音的预测语种。其中,因无标签训练数据能够弥补带标签训练数据中数据分布失衡的缺陷,使得基于带标签训练数据和无标签训练数据进行构建的语种识别模型具有较好的语种识别性能,如此能够提高语种识别准确性。