一种基于OCR的漏识文字自动检测的方法

基本信息

申请号 CN201610707049.X 申请日 -
公开(公告)号 CN106372632B 公开(公告)日 2019-04-16
申请公布号 CN106372632B 申请公布日 2019-04-16
分类号 G06K9/20(2006.01)I 分类 计算;推算;计数;
发明人 王长征; 王龙; 刘文晓; 张保花 申请(专利权)人 山西同方知网数字出版技术有限公司
代理机构 北京天奇智新知识产权代理有限公司 代理人 山西同方知网数字出版技术有限公司
地址 030006 山西省太原市高新区产业路48号新岛科技园D座
法律状态 -

摘要

摘要 本发明公开了一种基于OCR的漏识文字自动检测的方法,所述方法包括以下步骤:A对识别结果文件进行特征分析;B对没有问题的识别结果文件进行图像二值化处理;C检查图像非识别区域范围内是否有未识别内容,如果发现字符,存在漏识内容;否则,执行步骤D;D检查图像识别区域范围是否存在未识别内容,如果发现字符,存在漏识内容;否则,结束漏识文字检测。本发明可以通过依次检查图像的识别区域和非识别区域,自动全面检查图像识别结果是否有漏识,达到了自动化处理要求,这样解放了人力,提高了工作效率。