PDF文件中的表格解析方法及装置、计算设备、存储介质

基本信息

申请号 2019112272550 申请日 -
公开(公告)号 CN112287660A 公开(公告)日 2021-01-29
申请公布号 CN112287660A 申请公布日 2021-01-29
分类号 G06F40/205(2020.01)I;G06K9/00(2006.01)I 分类 计算;推算;计数;
发明人 秦晓宏;刘焕春 申请(专利权)人 上海柯林布瑞信息技术有限公司
代理机构 北京集佳知识产权代理有限公司 代理人 周书敏;张振军
地址 200233上海市徐汇区宜山路700号普天信息产业园B2栋1504A
法律状态 -

摘要

摘要 一种PDF文件中的表格解析方法及装置、计算设备、存储介质,所述PDF文件中的表格解析方法包括:将待识别PDF文件转换成对应的文本文件;根据所述文本文件的转换信息确定表格的位置;基于预设的目标关键词以及所述表格的位置,从所述表格中的文本内容提取与所述目标关键词对应的目标内容;至少输出所述目标内容。上述方案,能够提高从PDF文件中解析表格内容的准确度。