一种基于机器学习的通用OCR的训练数据生成系统及方法专利查询专利号|摘要-满商公司网

一种基于机器学习的通用OCR的训练数据生成系统及方法

基本信息

申请号	CN202110084710.7	申请日	-
公开（公告）号	CN112418224A	公开（公告）日	2021-02-26
申请公布号	CN112418224A	申请公布日	2021-02-26
分类号	G06N20/00(2019.01)I;G06T7/11(2017.01)I;G06K9/34(2006.01)I;G06K9/46(2006.01)I;G06K9/32(2006.01)I;G06K9/62(2006.01)I	分类	计算；推算；计数;
发明人	漆伟;张瑞冬;马永霄;童永鳌;朱鹏;张浩	申请（专利权）人	中国银行股份有限公司成都锦江支行
代理机构	成都为知盾专利代理事务所（特殊普通合伙）	代理人	李汉强
地址	610000四川省成都市高新区吉瑞三路99号1栋1单元20层2001号
法律状态	-

摘要

本发明公开了一种基于机器学习的通用OCR的训练数据生成系统及方法，该方法基于系统实现的，其步骤包括从语料库中随机抽取5‑10个文字作为文字信息；从字体库中随机选择字体生成字体信息；从图片库中随机抽取背景图片，依据通过字体信息生成的文字信息对图片进行裁剪；对图片背景的像素RGB值进行聚类算法分析找到聚类中心，然后从文字颜色库中随机抽取颜色，计算每种颜色到背景颜色值聚类中心的RGB值的距离再从距离最远的颜色中随机选取文字颜色；将文字信息、字体信息、背景图片、文字颜色结合生成可直接用于文本识别模型训练的图片，该方法采用真实场景背景图片，通过聚类分析来添加字体颜色，实现对文字识别模型的真实训练图片的完全自动模拟生成。