OCR文档识别方法及其装置

基本信息

申请号 CN201811493531.3 申请日 -
公开(公告)号 CN109614923B 公开(公告)日 2022-06-21
申请公布号 CN109614923B 申请公布日 2022-06-21
分类号 G06V30/412;G06V20/62;G06V30/10 分类 计算;推算;计数;
发明人 张波;陈成才 申请(专利权)人 上海智臻智能网络科技股份有限公司
代理机构 北京品源专利代理有限公司 代理人 孟金喆
地址 201803 上海市嘉定区金沙江西路1555弄398号7层
法律状态 -

摘要

摘要 本发明提供一种OCR文档识别方法、OCR文档识别装置、计算机设备以及计算机可读存储介质。所述方法包括:提供待识别的OCR文档;判断所述OCR文档中是否包括表格;当所述OCR文档中包括表格时,对所述OCR文档进行文字检测,并判断检测框中是否包括直线;当包括直线时,对所述OCR文档进行放大处理,直至检测框中不包括直线;对所述放大后的OCR文档进行文字识别处理。由于将OCR文档中的表格放大至合适位置,消除了表格的直线对检测造成的影响,因此提高了文档中表格内的文字识别准确率。