一种智慧工地的身份证字符识别训练数据生成方法及系统
基本信息
申请号 | CN202010863918.4 | 申请日 | - |
公开(公告)号 | CN112001397A | 公开(公告)日 | 2020-11-27 |
申请公布号 | CN112001397A | 申请公布日 | 2020-11-27 |
分类号 | G06K9/34(2006.01)I | 分类 | 计算;推算;计数; |
发明人 | 姜贺;安民洙 | 申请(专利权)人 | 腾晖科技建筑智能(深圳)有限公司 |
代理机构 | 广州三环专利商标代理有限公司 | 代理人 | 广东光速智能设备有限公司 |
地址 | 519000广东省珠海市高新区唐家湾镇创新三路60号7楼701 | ||
法律状态 | - |
摘要
摘要 | 本发明提供一种智慧工地的身份证字符识别训练数据生成方法及系统,该方法包括步骤S1,构建语料库;步骤S2,文字图像生成:对语料库中的每一类语料进行采样,经过字体渲染、形变增强得到二值文本图像;步骤S3,合成文本行图像:基于图像数据融合和基于GAN的图像翻译对二值文本图像进行身份证图像合成,得到身份证文本行图像。该系统用于实现上述的方法。本发明为智慧工地的身份证字符识别提供海量的训练数据,可以实现智慧工地的人员实名采集中身份证字符识别的训练数据问题,不仅可以提供海量的训练数据,还能大大节省人工标注成本。 |
