图片表格的识别方法、装置、电子设备及存储介质
基本信息
申请号 | CN202010682811.X | 申请日 | - |
公开(公告)号 | CN111860502A | 公开(公告)日 | 2020-10-30 |
申请公布号 | CN111860502A | 申请公布日 | 2020-10-30 |
分类号 | G06K9/32(2006.01)I | 分类 | 计算;推算;计数; |
发明人 | 蒙丽宇;汪明浩 | 申请(专利权)人 | 北京思图场景数据科技服务有限公司 |
代理机构 | 成都顶峰专利事务所(普通合伙) | 代理人 | 王霞 |
地址 | 100000北京市海淀区海淀大街8号A座10层A区 | ||
法律状态 | - |
摘要
摘要 | 本申请实施例提供了一种图片表格的识别方法、装置、电子设备及存储介质,涉及图像识别技术领域,该方法包括:对表格区域进行分割,得到横线分割灰度图、竖线分割灰度图、行区域分割灰度图和列区域分割灰度图;对二值化的横线分割灰度图、竖线分割灰度图、行区域分割灰度图和列区域分割灰度图进行连通区域分析和聚类,得横线段对象集合、竖线段对象集合、行区域像素点集合和列区域像素点集合;根据横线段对象集合、竖线段对象集合、行区域像素点集合与列区域像素点集,确定出多个单元格;将图片表格中提取出的文本内容添加至单元格中。本申请实施例提供的方法、装置、电子设备及存储介质可准确的识别出图片表格中的表格。 |
