一种识别PDF文件中的空格的方法

基本信息

申请号 CN201210455707.2 申请日 -
公开(公告)号 CN103810148B 公开(公告)日 2016-12-21
申请公布号 CN103810148B 申请公布日 2016-12-21
分类号 G06F17/22(2006.01)I 分类 计算;推算;计数;
发明人 周美玲 申请(专利权)人 福建福昕软件开发股份有限公司北京分公司
代理机构 北京科龙寰宇知识产权代理有限责任公司 代理人 孙皓晨
地址 350003 福建省福州市鼓楼区软件大道89号福州软件园G区5号楼
法律状态 -

摘要

摘要 本发明涉及一种识别PDF文件中的空格的方法。该方法包括:步骤1:遍历PDF文件,记录各对相邻字符之间的距离;步骤2:确定各对相邻字符之间的距离中的最小值h;步骤3:用各对相邻字符之间的距离减去h,得到各对相邻字符之间的相对距离;步骤4:依次判断各对相邻字符之间的相对距离是否小于预知的空格宽度,是则该对相邻字符之间的空隙不是空格,否则,该对相邻字符之间的空隙包括空格。本发明能提高相邻字符之间是否存在空格的判断准确率。