一种生成训练集的方法及装置

基本信息

申请号 CN201810876278.3 申请日 -
公开(公告)号 CN109241997A 公开(公告)日 2019-01-18
申请公布号 CN109241997A 申请公布日 2019-01-18
分类号 G06K9/62 分类 计算;推算;计数;
发明人 杨宗谕;田文静;谭熠;庄焰;陈锐;黄昭献;王友干 申请(专利权)人 硕橙(厦门)科技有限公司
代理机构 - 代理人 -
地址 361000 福建省厦门市集美区软件园三期诚毅大街349号小样青年社区0室
法律状态 -

摘要

摘要 本发明提供一种生成训练集的方法及装置,该方法包括:获取未标注的数据集,从未标注的数据集中选取数据模板;根据数据模板对未标注的数据集进行标注,得到第一训练集;根据第一训练集训练神经网络;根据神经网络和第一训练集,生成未标注的数据集对应的标记训练集。本发明选取几个数据模板,结合训练的神经网络,通过循环校正的方式生成准确性很高的标记训练集,降低了数据标记人员的技术门槛,不需要对每个数据依次操作,只需要对一些可疑位置反复检查,循环校正优化,节约了大量的时间和人工成本。