一种识别PDF文件中的空格的方法
基本信息
申请号 | CN201210455707.2 | 申请日 | - |
公开(公告)号 | CN103810148B | 公开(公告)日 | 2016-12-21 |
申请公布号 | CN103810148B | 申请公布日 | 2016-12-21 |
分类号 | G06F17/22(2006.01)I | 分类 | 计算;推算;计数; |
发明人 | 周美玲 | 申请(专利权)人 | 福建福昕软件开发股份有限公司北京分公司 |
代理机构 | 北京科龙寰宇知识产权代理有限责任公司 | 代理人 | 孙皓晨 |
地址 | 350003 福建省福州市鼓楼区软件大道89号福州软件园G区5号楼 | ||
法律状态 | - |
摘要
摘要 | 本发明涉及一种识别PDF文件中的空格的方法。该方法包括:步骤1:遍历PDF文件,记录各对相邻字符之间的距离;步骤2:确定各对相邻字符之间的距离中的最小值h;步骤3:用各对相邻字符之间的距离减去h,得到各对相邻字符之间的相对距离;步骤4:依次判断各对相邻字符之间的相对距离是否小于预知的空格宽度,是则该对相邻字符之间的空隙不是空格,否则,该对相邻字符之间的空隙包括空格。本发明能提高相邻字符之间是否存在空格的判断准确率。 |
