基于难样本的训练方法、装置及电子设备

基本信息

申请号 CN201810675642.X 申请日 -
公开(公告)号 CN108960314B 公开(公告)日 2022-02-11
申请公布号 CN108960314B 申请公布日 2022-02-11
分类号 G06K9/62(2006.01)I 分类 计算;推算;计数;
发明人 朱星宇;黄鼎;张诚 申请(专利权)人 杭州旷云金智科技有限公司
代理机构 北京超凡志成知识产权代理事务所(普通合伙) 代理人 王术兰
地址 100096 北京市海淀区西三旗建材城内建中路12幢一层1268号
法律状态 -

摘要

摘要 本发明提供了一种基于难样本的训练方法、装置及电子设备,该方法首先利用预训练模型对公开数据集中的样本进行遍历识别,获得被误识别为目标类的负类样本,将该负类样本添加至包括正类样本的第一数据集中,形成第二数据集;然后基于该第二数据集,利用预选代价函数和预先设定的难样本针对性代价函数对初始模型进行训练,得到输出模型。该方式将从公开数据集中挑选出的负类样本,加入后续用于训练的数据集中,然后利用预先设定的难样本针对性代价函数,基于该包含负类样本的数据集进行模型训练,从而加强对易识别为FP的难样本的识别学习,在不增加模型输出类别的情况下,有效抑制FP的同时,提升模型的识别准确率,改善用户的使用体验。