一种表格识别方法

基本信息

申请号 CN201910692195.3 申请日 -
公开(公告)号 CN110647795A 公开(公告)日 2020-01-03
申请公布号 CN110647795A 申请公布日 2020-01-03
分类号 G06K9/00(2006.01); G06K9/32(2006.01) 分类 计算;推算;计数;
发明人 程涛 申请(专利权)人 正和智能网络科技(广州)有限公司
代理机构 广州三环专利商标代理有限公司 代理人 正和智能网络科技(广州)有限公司
地址 510000 广东省广州市天河区马场路28号之一2802房
法律状态 -

摘要

摘要 本发明公开了一种表格识别方法,包括:获取初始表格图像,并对初始表格图像进行水平校正及垂直校正以生成校正表格图像;将校正表格图像转换成灰度图,生成灰度表格图像,对灰度表格图像进行高斯自适应二值化处理,生成前景掩模;采用基于组合形态学的方法对前景掩模进行腐蚀操作及膨胀操作以提取表格线,并生成表格前景;查找表格前景的轮廓,生成表格区域;使用卷积神经网络对每个表格区域的文本图像行进行识别,输出识别文字。采用本发明,对表格图像进行识别时进行倾斜度校正处理,并对形状畸变、亮度不均进行处理,提高表格识别的准确率。