PDF文件中的表格解析方法及装置、计算设备、存储介质
基本信息
申请号 | 2019112272550 | 申请日 | - |
公开(公告)号 | CN112287660A | 公开(公告)日 | 2021-01-29 |
申请公布号 | CN112287660A | 申请公布日 | 2021-01-29 |
分类号 | G06F40/205(2020.01)I;G06K9/00(2006.01)I | 分类 | 计算;推算;计数; |
发明人 | 秦晓宏;刘焕春 | 申请(专利权)人 | 上海柯林布瑞信息技术有限公司 |
代理机构 | 北京集佳知识产权代理有限公司 | 代理人 | 周书敏;张振军 |
地址 | 200233上海市徐汇区宜山路700号普天信息产业园B2栋1504A | ||
法律状态 | - |
摘要
摘要 | 一种PDF文件中的表格解析方法及装置、计算设备、存储介质,所述PDF文件中的表格解析方法包括:将待识别PDF文件转换成对应的文本文件;根据所述文本文件的转换信息确定表格的位置;基于预设的目标关键词以及所述表格的位置,从所述表格中的文本内容提取与所述目标关键词对应的目标内容;至少输出所述目标内容。上述方案,能够提高从PDF文件中解析表格内容的准确度。 |
