一种结合标注质量控制的主动学习方法

基本信息

申请号 CN202110036696.3 申请日 -
公开(公告)号 CN112766347A 公开(公告)日 2021-05-07
申请公布号 CN112766347A 申请公布日 2021-05-07
分类号 G06K9/62(2006.01)I;G06N3/08(2006.01)I 分类 -
发明人 宋艳枝;王星宇 申请(专利权)人 合肥黎曼信息科技有限公司
代理机构 安徽省蚌埠博源专利商标事务所(普通合伙) 代理人 朱恒兰
地址 230001安徽省合肥市高新区创新大道2800号创新产业园二期J1栋A座1027室
法律状态 -

摘要

摘要 本发明涉及主动学习技术领域,具体涉及一种结合标注质量控制的主动学习方法,包括以下步骤:S1:训练模型;S2:对未标注样本进行伪标注;S3:分折计算观测距离S4:基于观测距离挑选待标注和待检查的样本,基于观测距离挑选待标注和待检查的样本,对于需要标注的样本,将其标注后加入已标注样本集,对于需要检查的样本,对其进行一次额外的标注,再基于已有的历史标注确定其标注,然后更新已标注样本集,完成本步骤后返回步骤S1,直到模型性能可以接受,或者达到了标注预算限制;这种结合标注质量控制的主动学习方法,可以在主动学习的同时控制标注质量。