一种任意字符组合的OCR数据生成的方法

基本信息

申请号 CN202110978686.1 申请日 -
公开(公告)号 CN113435163A 公开(公告)日 2021-09-24
申请公布号 CN113435163A 申请公布日 2021-09-24
分类号 G06F40/109(2020.01)I;G06F40/242(2020.01)I;G06F40/279(2020.01)I;G06K9/20(2006.01)I 分类 计算;推算;计数;
发明人 苗功勋;孙强;陈姝;熊英超;韦文峰 申请(专利权)人 南京中孚信息技术有限公司
代理机构 - 代理人 -
地址 210000江苏省南京市浦口区浦口大道13号新城总部大厦B座21层
法律状态 -

摘要

摘要 本发明公开了光学字符识别技术领域的一种任意字符组合的OCR数据生成的方法,包括通过字符字典、字体库和语料库生成字符‑字体映射字典,得到字符和所有支持的字体之间的对应关系;从语料库中获取待生成图片的一行文本,切分文本成多个字符串,找到各个字符串与其对应的字体;将找到的各个字符串对应的字体进行排列得到文字图片;将文字图片进行拼接得到最终图片;本发明改进了以往OCR数据生成时,在背景图片上绘制指定文字的环节,实现了任意字符组合的OCR数据生成方式,简单高效。