表格识别方法、识别系统及计算机装置
基本信息
申请号 | CN201810857609.9 | 申请日 | - |
公开(公告)号 | CN109086714B | 公开(公告)日 | 2020-12-04 |
申请公布号 | CN109086714B | 申请公布日 | 2020-12-04 |
分类号 | G06K9/00;G06K9/34 | 分类 | 计算;推算;计数; |
发明人 | 李自豪 | 申请(专利权)人 | 国科赛思(北京)科技有限公司 |
代理机构 | 北京市商泰律师事务所 | 代理人 | 黄晓军 |
地址 | 100085 北京市海淀区安宁庄西路9号院29号楼5层507室 | ||
法律状态 | - |
摘要
摘要 | 本发明提供了一种表格识别方法和系统,属于表格识别技术领域,利用基于加权RC阈值迭代的非线性对比增强及高斯拉普拉斯LoG算子对符合格式的表格图像进行二值化处理,利用基于透视变化的倾斜校正算法进行倾斜校正;利用图像形态学处理方法提取表格框线,对单元格进行分割,获取最小单元格;建立最小单元格的字符数据库,进行神经网络训练,建立表格识别模型,对表格进行识别。本发明计算简、速度快,可精确识别对比度较弱、图像明暗分布不均且背景模糊的表格图像;倾斜校正速度快、效果好,建立专有的高频字符,训练专有的神经网络,进行模板匹配,提高了识别速度和精度,同时定制化神经网络结构简单,减少了训练和调优的时间和工作量。 |
