一种基于机器学习的通用OCR的训练数据生成系统及方法
基本信息
申请号 | CN202110084710.7 | 申请日 | - |
公开(公告)号 | CN112418224A | 公开(公告)日 | 2021-02-26 |
申请公布号 | CN112418224A | 申请公布日 | 2021-02-26 |
分类号 | G06N20/00(2019.01)I;G06T7/11(2017.01)I;G06K9/34(2006.01)I;G06K9/46(2006.01)I;G06K9/32(2006.01)I;G06K9/62(2006.01)I | 分类 | 计算;推算;计数; |
发明人 | 漆伟;张瑞冬;马永霄;童永鳌;朱鹏;张浩 | 申请(专利权)人 | 中国银行股份有限公司成都锦江支行 |
代理机构 | 成都为知盾专利代理事务所(特殊普通合伙) | 代理人 | 李汉强 |
地址 | 610000四川省成都市高新区吉瑞三路99号1栋1单元20层2001号 | ||
法律状态 | - |
摘要
摘要 | 本发明公开了一种基于机器学习的通用OCR的训练数据生成系统及方法,该方法基于系统实现的,其步骤包括从语料库中随机抽取5‑10个文字作为文字信息;从字体库中随机选择字体生成字体信息;从图片库中随机抽取背景图片,依据通过字体信息生成的文字信息对图片进行裁剪;对图片背景的像素RGB值进行聚类算法分析找到聚类中心,然后从文字颜色库中随机抽取颜色,计算每种颜色到背景颜色值聚类中心的RGB值的距离再从距离最远的颜色中随机选取文字颜色;将文字信息、字体信息、背景图片、文字颜色结合生成可直接用于文本识别模型训练的图片,该方法采用真实场景背景图片,通过聚类分析来添加字体颜色,实现对文字识别模型的真实训练图片的完全自动模拟生成。 |
