图片表格的识别方法、装置、电子设备及存储介质

基本信息

申请号 CN202010682811.X 申请日 -
公开(公告)号 CN111860502A 公开(公告)日 2020-10-30
申请公布号 CN111860502A 申请公布日 2020-10-30
分类号 G06K9/32(2006.01)I 分类 计算;推算;计数;
发明人 蒙丽宇;汪明浩 申请(专利权)人 北京思图场景数据科技服务有限公司
代理机构 成都顶峰专利事务所(普通合伙) 代理人 王霞
地址 100000北京市海淀区海淀大街8号A座10层A区
法律状态 -

摘要

摘要 本申请实施例提供了一种图片表格的识别方法、装置、电子设备及存储介质,涉及图像识别技术领域,该方法包括:对表格区域进行分割,得到横线分割灰度图、竖线分割灰度图、行区域分割灰度图和列区域分割灰度图;对二值化的横线分割灰度图、竖线分割灰度图、行区域分割灰度图和列区域分割灰度图进行连通区域分析和聚类,得横线段对象集合、竖线段对象集合、行区域像素点集合和列区域像素点集合;根据横线段对象集合、竖线段对象集合、行区域像素点集合与列区域像素点集,确定出多个单元格;将图片表格中提取出的文本内容添加至单元格中。本申请实施例提供的方法、装置、电子设备及存储介质可准确的识别出图片表格中的表格。