表格单元格抽出方法、装置、设备及计算机可读存储介质
基本信息
申请号 | CN202010981003.3 | 申请日 | - |
公开(公告)号 | CN112528724A | 公开(公告)日 | 2021-03-19 |
申请公布号 | CN112528724A | 申请公布日 | 2021-03-19 |
分类号 | G06F16/25(2019.01)I;G06K9/00(2006.01)I;G06K9/20(2006.01)I;G06T5/00(2006.01)I | 分类 | 计算;推算;计数; |
发明人 | 时慧 | 申请(专利权)人 | 上海海隆软件有限公司 |
代理机构 | 重庆壹手知专利代理事务所(普通合伙) | 代理人 | 彭啟强 |
地址 | 200000上海市徐汇区宜山路700号85幢12楼 | ||
法律状态 | - |
摘要
摘要 | 本发明属于模式识别与装置中的光学字符识别技术领域,具体涉及表格单元格抽出方法、装置、设备及计算机可读存储介质。本发明公开了种表格单元格抽出方法,其特征在于,包括以下步骤:S1:对图片进行横向线段的检测,利用识别出的线段,对图片进行角度矫正;S2:对所述S1角度矫正后的图片进行水平和垂直的表格线段的识别,利用线段对表格进行补全;S3:对所述S2补全后的表格图片进行泛洪填充处理,依次识别出单元格信息;S4:利用所述S3中识别出的单元格信息,排除误识别的单元格;S5:对所述S4识别后的单元格信息,根据已有信息,对进行表格的重构。 |
