一种生成训练集的方法及装置
基本信息
申请号 | CN201810876278.3 | 申请日 | - |
公开(公告)号 | CN109241997A | 公开(公告)日 | 2019-01-18 |
申请公布号 | CN109241997A | 申请公布日 | 2019-01-18 |
分类号 | G06K9/62 | 分类 | 计算;推算;计数; |
发明人 | 杨宗谕;田文静;谭熠;庄焰;陈锐;黄昭献;王友干 | 申请(专利权)人 | 硕橙(厦门)科技有限公司 |
代理机构 | - | 代理人 | - |
地址 | 361000 福建省厦门市集美区软件园三期诚毅大街349号小样青年社区0室 | ||
法律状态 | - |
摘要
摘要 | 本发明提供一种生成训练集的方法及装置,该方法包括:获取未标注的数据集,从未标注的数据集中选取数据模板;根据数据模板对未标注的数据集进行标注,得到第一训练集;根据第一训练集训练神经网络;根据神经网络和第一训练集,生成未标注的数据集对应的标记训练集。本发明选取几个数据模板,结合训练的神经网络,通过循环校正的方式生成准确性很高的标记训练集,降低了数据标记人员的技术门槛,不需要对每个数据依次操作,只需要对一些可疑位置反复检查,循环校正优化,节约了大量的时间和人工成本。 |
