一种用于OCR图像识别模型训练数据生成的方法及设备
基本信息

| 申请号 | CN202011356431.3 | 申请日 | - |
| 公开(公告)号 | CN112508000A | 公开(公告)日 | 2021-03-16 |
| 申请公布号 | CN112508000A | 申请公布日 | 2021-03-16 |
| 分类号 | G06K9/20(2006.01)I;G06K9/36(2006.01)I;G06K9/62(2006.01)I | 分类 | 计算;推算;计数; |
| 发明人 | 唐栎;谢利如 | 申请(专利权)人 | 上海展湾信息科技有限公司 |
| 代理机构 | 上海百一领御专利代理事务所(普通合伙) | 代理人 | 王奎宇;朱永海 |
| 地址 | 200090上海市杨浦区黄兴路217号A座14层A1401、A1403号 | ||
| 法律状态 | - | ||
摘要

| 摘要 | 本申请通过一种用于OCR图像识别模型训练数据生成的方法及设备,获取OCR图像,其中,所述OCR图像包含一个或者多个参数的名称及参数值;基于所述参数,将所述OCR图像裁剪为若干个参数图片;识别每个参数图片中的每个字符;基于预设字符数据库及预设标注数据库,将每个字符对应的字符图片顺序拼接,并将每个字符图片的标注顺序组合,以获得参数图片的拼接图片及其标注;遍历每个参数图片,将获得的每个拼接图片顺序拼接,以确定所述OCR图像对应的拼接图片,并将获得的每个拼接图片的标注顺序组合,以确定所述OCR图像对应的拼接图片的标注;将所述OCR图像对应的拼接图片及其标注确定为所述OCR图像识别模型的训练数据。通过该方法可获得高质量的训练数据。 |





