一种神经网络模型交互训练方法、装置及存储介质

基本信息

申请号 CN202111545139.0 申请日 -
公开(公告)号 CN114219078A 公开(公告)日 2022-03-22
申请公布号 CN114219078A 申请公布日 2022-03-22
分类号 G06N3/04(2006.01)I;G06N3/08(2006.01)I 分类 计算;推算;计数;
发明人 乔少华 申请(专利权)人 武汉中海庭数据技术有限公司
代理机构 武汉蓝宝石专利代理事务所(特殊普通合伙) 代理人 万畅
地址 430000湖北省武汉市东湖新技术开发区软件园东路1号软件园4.1期B6栋1层、9层、10层01室(自贸区武汉片区)
法律状态 -

摘要

摘要 本发明涉及一种神经网络模型交互训练方法及装置,其方法包括:确定参与交互训练的一个主神经网络,以及至少一个次神经网络;根据所述主神经网络和次神经网络之间的分布差异,确定参与交互训练的目标函数;根据所述目标函数训练所述主神经网络和次神经网络,直至目标函数值达到阈值且趋于稳定,得到训练完成的主神经网络。本发明提出一种神经网络交互训练方法,同时采用KL散度来度量主网络与次网络的预测概率分布差异,实现主次网络交互学习经验来引导主网络学习,从而获得与次网络相近或略高的性能,也缓解了主网络单独训练时收敛缓慢,容易陷入局部最优,特别在训练样本量限制条件下,网络模型泛化性较弱,检出率偏低等问题。