一种扩充类别式数据快速标注方法
基本信息

| 申请号 | CN201910626205.3 | 申请日 | - |
| 公开(公告)号 | CN110334772A | 公开(公告)日 | 2019-10-15 |
| 申请公布号 | CN110334772A | 申请公布日 | 2019-10-15 |
| 分类号 | G06K9/62;G06N3/04;G06N3/08 | 分类 | 计算;推算;计数; |
| 发明人 | 朱顺意;范继辉;瞿明军;李广立;刘雪健;周莉;巩志远;陈建学;杜来民;邓国超;白玥寅;张松;周雨晨 | 申请(专利权)人 | 山东领能电子科技有限公司 |
| 代理机构 | 济南金迪知识产权代理有限公司 | 代理人 | 山东领能电子科技有限公司;山东大学;太原理工大学 |
| 地址 | 250101 山东省济南市历下区新泺大街1166号奥盛大厦3号楼15层1505房间 | ||
| 法律状态 | - | ||
摘要

| 摘要 | 本发明涉及一种扩充类别式数据快速标注方法,包括以下步骤:(1)获取带有统一标注A的初始数据集;(2)结合已有数据集,将A进一步分为a、b、c等多个子类;(3)选取初始数据集的一部分作为样本,通过人工修改标注文件,快捷地将标注从A重命名为a、b、c等,得到标注样本;(4)基于标注样本,利用神经网络训练模型,将所得模型对初始数据集中剩余的数据进行预标注,得到预标注数据;(5)对预标注数据进行人工微调,保证所涉及数据标签全部准确,基于初始数据与微调数据对模型训练优化,基于更多标注样本训练更优模型,最终准确地标注全部数据,提高标注效率;本发明能满足快速、准确地标注的需求,更好地服务于实际应用。 |





