一种模型蒸馏训练方法、装置、电子设备及存储介质

基本信息

申请号 CN202111186029.X 申请日 -
公开(公告)号 CN113935234A 公开(公告)日 2022-01-14
申请公布号 CN113935234A 申请公布日 2022-01-14
分类号 G06F30/27(2020.01)I;G06K9/62(2022.01)I;G06N20/00(2019.01)I;G06V10/764(2022.01)I;G06V10/774(2022.01)I;G06V10/82(2022.01)I 分类 计算;推算;计数;
发明人 胡加明;李健铨;吴相博;刘小康 申请(专利权)人 鼎富智能科技有限公司
代理机构 北京超凡宏宇专利代理事务所(特殊普通合伙) 代理人 唐正瑜
地址 230000安徽省合肥市高新区习友路3333号A1楼19层-B区
法律状态 -

摘要

摘要 本申请提供一种模型蒸馏训练方法、装置、电子设备及存储介质,用于改善对长尾类别的样本识别正确率提高十分有限的问题。该方法包括:获取包括长尾类别的训练数据集,并使用多种数据增强手段对训练数据集进行数据增强,获得多个数据集合;使用多个数据集合分别对多个老师模型进行不同种类的损失优化训练,获得训练后的多个老师模型,一个老师模型是使用一个数据集合进行一个种类的损失优化训练获得的;根据准确率从多个老师模型中选择出预设数量的老师模型;获取预设数量的学生模型,使用老师模型对学生模型进行蒸馏训练,获得预设数量蒸馏后的学生模型;从预设数量蒸馏后的学生模型中筛选出准确率最高的学生模型。