一种扩充类别式数据快速标注方法

基本信息

申请号 CN201910626205.3 申请日 -
公开(公告)号 CN110334772A 公开(公告)日 2019-10-15
申请公布号 CN110334772A 申请公布日 2019-10-15
分类号 G06K9/62;G06N3/04;G06N3/08 分类 计算;推算;计数;
发明人 朱顺意;范继辉;瞿明军;李广立;刘雪健;周莉;巩志远;陈建学;杜来民;邓国超;白玥寅;张松;周雨晨 申请(专利权)人 山东领能电子科技有限公司
代理机构 济南金迪知识产权代理有限公司 代理人 山东领能电子科技有限公司;山东大学;太原理工大学
地址 250101 山东省济南市历下区新泺大街1166号奥盛大厦3号楼15层1505房间
法律状态 -

摘要

摘要 本发明涉及一种扩充类别式数据快速标注方法,包括以下步骤:(1)获取带有统一标注A的初始数据集;(2)结合已有数据集,将A进一步分为a、b、c等多个子类;(3)选取初始数据集的一部分作为样本,通过人工修改标注文件,快捷地将标注从A重命名为a、b、c等,得到标注样本;(4)基于标注样本,利用神经网络训练模型,将所得模型对初始数据集中剩余的数据进行预标注,得到预标注数据;(5)对预标注数据进行人工微调,保证所涉及数据标签全部准确,基于初始数据与微调数据对模型训练优化,基于更多标注样本训练更优模型,最终准确地标注全部数据,提高标注效率;本发明能满足快速、准确地标注的需求,更好地服务于实际应用。