表格提取方法、装置、电子设备及可读存储介质
基本信息
申请号 | CN202011635683.X | 申请日 | - |
公开(公告)号 | CN112766073B | 公开(公告)日 | 2022-06-10 |
申请公布号 | CN112766073B | 申请公布日 | 2022-06-10 |
分类号 | G06V30/412(2022.01)I;G06V10/22(2022.01)I;G06V10/80(2022.01)I;G06V10/44(2022.01)I;G06V10/82(2022.01)I | 分类 | 计算;推算;计数; |
发明人 | 李壮 | 申请(专利权)人 | 贝壳技术有限公司 |
代理机构 | 北京路浩知识产权代理有限公司 | 代理人 | - |
地址 | 100085 北京市海淀区西二旗西路2号院35号楼01层102-1 | ||
法律状态 | - |
摘要
摘要 | 本发明提供一种表格提取方法、装置、电子设备及可读存储介质,其中所述方法包括:基于深度神经网络模型,提取目标图像中的表格像素,所述目标图像中包括目标表格;基于所述表格像素,通过增强像素处理并利用连通域分析技术,提取所述目标图像中的候选表格区域;利用基于面积的非极大值抑制算法模型,对所述候选表格区域进行过滤,提取所述目标表格。本发明基于语义分割进行表格检测,通过对提取的表格像素进行增强像素处理提取有效的候选表格区域,并采用基于面积的非极大值抑制算法对候选表格区域进行过滤,能够在准确预测表格位置的同时,完整精确的处理表格边缘,从而能最大程度的记录表格的完整信息,因此准确性和可靠性更高。 |
