图像识别转换装置、方法及计算机可读取的记录媒介物

基本信息

申请号 CN202111215548.4 申请日 -
公开(公告)号 CN113947777A 公开(公告)日 2022-01-18
申请公布号 CN113947777A 申请公布日 2022-01-18
分类号 G06V30/412(2022.01)I;G06V10/44(2022.01)I;G06F40/151(2020.01)I 分类 计算;推算;计数;
发明人 顾炯 申请(专利权)人 理光图像技术(上海)有限公司
代理机构 上海德昭知识产权代理有限公司 代理人 郁旦蓉
地址 200233上海市徐汇区桂菁路7号3号楼4F
法律状态 -

摘要

摘要 本发明的目的在于提供一种将含有由表格线形成有多个单元格的图像表格以及含有与各个单元格相对应的表格内容的待转换图像转换为结构化数据的图像识别转换装置、图像识别转换方法以及计算机可读取的记录媒介物。本发明的图像识别转换装置包括:直线识别设定部,识别表格线并设定对应的表格直线;初始表格形成部,根据表格直线形成初始表格;分界线区域获取部,获取相邻两个网格之间的分界线区域;分界线判断部,判断各个分界线区域是否存在表格分界线;单元格设定部,在判断为存在表格分界线时将相邻两个网格分别设定为单元格,并在判断不存在时将相邻两个网格合并后设定为单元格;以及最终表格形成部,形成结构化数据表格作为最终表格。