一种任意字符组合的OCR数据生成的方法
基本信息
申请号 | CN202110978686.1 | 申请日 | - |
公开(公告)号 | CN113435163A | 公开(公告)日 | 2021-09-24 |
申请公布号 | CN113435163A | 申请公布日 | 2021-09-24 |
分类号 | G06F40/109(2020.01)I;G06F40/242(2020.01)I;G06F40/279(2020.01)I;G06K9/20(2006.01)I | 分类 | 计算;推算;计数; |
发明人 | 苗功勋;孙强;陈姝;熊英超;韦文峰 | 申请(专利权)人 | 南京中孚信息技术有限公司 |
代理机构 | - | 代理人 | - |
地址 | 210000江苏省南京市浦口区浦口大道13号新城总部大厦B座21层 | ||
法律状态 | - |
摘要
摘要 | 本发明公开了光学字符识别技术领域的一种任意字符组合的OCR数据生成的方法,包括通过字符字典、字体库和语料库生成字符‑字体映射字典,得到字符和所有支持的字体之间的对应关系;从语料库中获取待生成图片的一行文本,切分文本成多个字符串,找到各个字符串与其对应的字体;将找到的各个字符串对应的字体进行排列得到文字图片;将文字图片进行拼接得到最终图片;本发明改进了以往OCR数据生成时,在背景图片上绘制指定文字的环节,实现了任意字符组合的OCR数据生成方式,简单高效。 |
