表格单元格抽出方法、装置、设备及计算机可读存储介质

基本信息

申请号 CN202010981003.3 申请日 -
公开(公告)号 CN112528724A 公开(公告)日 2021-03-19
申请公布号 CN112528724A 申请公布日 2021-03-19
分类号 G06F16/25(2019.01)I;G06K9/00(2006.01)I;G06K9/20(2006.01)I;G06T5/00(2006.01)I 分类 计算;推算;计数;
发明人 时慧 申请(专利权)人 上海海隆软件有限公司
代理机构 重庆壹手知专利代理事务所(普通合伙) 代理人 彭啟强
地址 200000上海市徐汇区宜山路700号85幢12楼
法律状态 -

摘要

摘要 本发明属于模式识别与装置中的光学字符识别技术领域,具体涉及表格单元格抽出方法、装置、设备及计算机可读存储介质。本发明公开了种表格单元格抽出方法,其特征在于,包括以下步骤:S1:对图片进行横向线段的检测,利用识别出的线段,对图片进行角度矫正;S2:对所述S1角度矫正后的图片进行水平和垂直的表格线段的识别,利用线段对表格进行补全;S3:对所述S2补全后的表格图片进行泛洪填充处理,依次识别出单元格信息;S4:利用所述S3中识别出的单元格信息,排除误识别的单元格;S5:对所述S4识别后的单元格信息,根据已有信息,对进行表格的重构。