一种基于多助教模型知识蒸馏训练的文本分类方法
基本信息

| 申请号 | CN202210329290.9 | 申请日 | - |
| 公开(公告)号 | CN114676256A | 公开(公告)日 | 2022-06-28 |
| 申请公布号 | CN114676256A | 申请公布日 | 2022-06-28 |
| 分类号 | G06F16/35(2019.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I | 分类 | 计算;推算;计数; |
| 发明人 | 高尚兵;张骏强;苏睿;王媛媛;张海艳;马甲林;张正伟;朱全银 | 申请(专利权)人 | 淮阴工学院 |
| 代理机构 | 南京经纬专利商标代理有限公司 | 代理人 | - |
| 地址 | 210000江苏省淮安市北京北路89号 | ||
| 法律状态 | - | ||
摘要

| 摘要 | 本发明专利涉及一种基于多助教模型知识蒸馏训练的文本分类方法,首先根据样本数据,分别针对主教师模型、副教师模型进行训练,接着根据样本数据,结合副教师模型与主教师模型对助教模型的联合渐进蒸馏,同时副教师模型与助教模型之间进行相互学习;再通过对副教师模型与助教模型联合渐进蒸馏得到第一学生模型,并继续对第一学生模型与副教师模型进行联合蒸馏,得到第二学生模型与第三学生模型,并相互学习;最后得到文本分类精度高的第一学生模型、推理速度快的第三学生模型、以及处于两者之间水平的第二学生模型;在实际应用中,将文本输入相应学生模型,得到相应类型下的文本分类结果,有效加快了模型推理速度,提高学生模型文本分类准确度。 |





