文档图像中的表格解析方法及装置

基本信息

申请号 CN201810162749.4 申请日 -
公开(公告)号 CN108416279A 公开(公告)日 2018-08-17
申请公布号 CN108416279A 申请公布日 2018-08-17
分类号 G06K9/00 分类 计算;推算;计数;
发明人 余宙;杨永智;汪贤 申请(专利权)人 北京阿博茨科技有限公司
代理机构 北京市领专知识产权代理有限公司 代理人 林辉轮;张玲
地址 100192 北京市海淀区学清路8号科技财富中心A座2层201
法律状态 -

摘要

摘要 本发明涉及一种文档图像中的表格解析方法及装置,所述方法包括步骤:利用预先训练的表格检测模型,检测出待解析文档图像中的表格区域;利用预先训练的文字检测模型,检测出该表格区域中所包含的内部文字块;确定表格的空间结构;根据表格的空间结构对每个单元格中的文字块进行文字识别,从而解析得到可编辑的结构化数据。本发明方法及装置可以适用于有线表格或无线表格或黑白表格等各种形式的表格,为文档图像中的表格解析提供了一套既简单又有效的解决方案。