一种神经网络模型交互训练方法、装置及存储介质
基本信息
申请号 | CN202111545139.0 | 申请日 | - |
公开(公告)号 | CN114219078A | 公开(公告)日 | 2022-03-22 |
申请公布号 | CN114219078A | 申请公布日 | 2022-03-22 |
分类号 | G06N3/04(2006.01)I;G06N3/08(2006.01)I | 分类 | 计算;推算;计数; |
发明人 | 乔少华 | 申请(专利权)人 | 武汉中海庭数据技术有限公司 |
代理机构 | 武汉蓝宝石专利代理事务所(特殊普通合伙) | 代理人 | 万畅 |
地址 | 430000湖北省武汉市东湖新技术开发区软件园东路1号软件园4.1期B6栋1层、9层、10层01室(自贸区武汉片区) | ||
法律状态 | - |
摘要
摘要 | 本发明涉及一种神经网络模型交互训练方法及装置,其方法包括:确定参与交互训练的一个主神经网络,以及至少一个次神经网络;根据所述主神经网络和次神经网络之间的分布差异,确定参与交互训练的目标函数;根据所述目标函数训练所述主神经网络和次神经网络,直至目标函数值达到阈值且趋于稳定,得到训练完成的主神经网络。本发明提出一种神经网络交互训练方法,同时采用KL散度来度量主网络与次网络的预测概率分布差异,实现主次网络交互学习经验来引导主网络学习,从而获得与次网络相近或略高的性能,也缓解了主网络单独训练时收敛缓慢,容易陷入局部最优,特别在训练样本量限制条件下,网络模型泛化性较弱,检出率偏低等问题。 |
