一种结合标注质量控制的主动学习方法
基本信息
申请号 | CN202110036696.3 | 申请日 | - |
公开(公告)号 | CN112766347A | 公开(公告)日 | 2021-05-07 |
申请公布号 | CN112766347A | 申请公布日 | 2021-05-07 |
分类号 | G06K9/62(2006.01)I;G06N3/08(2006.01)I | 分类 | - |
发明人 | 宋艳枝;王星宇 | 申请(专利权)人 | 合肥黎曼信息科技有限公司 |
代理机构 | 安徽省蚌埠博源专利商标事务所(普通合伙) | 代理人 | 朱恒兰 |
地址 | 230001安徽省合肥市高新区创新大道2800号创新产业园二期J1栋A座1027室 | ||
法律状态 | - |
摘要
摘要 | 本发明涉及主动学习技术领域,具体涉及一种结合标注质量控制的主动学习方法,包括以下步骤:S1:训练模型;S2:对未标注样本进行伪标注;S3:分折计算观测距离S4:基于观测距离挑选待标注和待检查的样本,基于观测距离挑选待标注和待检查的样本,对于需要标注的样本,将其标注后加入已标注样本集,对于需要检查的样本,对其进行一次额外的标注,再基于已有的历史标注确定其标注,然后更新已标注样本集,完成本步骤后返回步骤S1,直到模型性能可以接受,或者达到了标注预算限制;这种结合标注质量控制的主动学习方法,可以在主动学习的同时控制标注质量。 |
