横向校对和输出双层PDF的方法和装置
基本信息
申请号 | CN201310558843.9 | 申请日 | - |
公开(公告)号 | CN103714047B | 公开(公告)日 | 2017-10-10 |
申请公布号 | CN103714047B | 申请公布日 | 2017-10-10 |
分类号 | G06F17/25(2006.01)I | 分类 | 计算;推算;计数; |
发明人 | 段雅东;陈永生;高志强 | 申请(专利权)人 | 知识产权出版社有限责任公司 |
代理机构 | 北京康信知识产权代理有限责任公司 | 代理人 | 吴贵明;张永明 |
地址 | 100088 北京市马甸南村1号 | ||
法律状态 | - |
摘要
摘要 | 一种横向校对和输出双层PDF的方法和装置,涉及文字处理领域。本发明实施例提供的方法,包括如下步骤:从OCR识别引擎记录的每个字符在图像中的外接矩形的位置导入行图像和字符图像的位置;修改错误文字和修改文字位置;根据字符图像位置和大小输出双层PDF文件。本发明适用于文字校对、双层PDF文件加工系统。本发明为解决目前书籍资料电子化生成双层PDF过程中文字位置校正精度低、效率低的问题而发明。利用OCR识别的文字位置信息导入行图像和字符图像的位置,在文字校对的过程中,通过拆分、合并和调整字符图像位置,使输出的双层PDF文件文字层和图像层完全重合,相对之前的双层PDF生成方法,本发明大大减少了修改工作量,提高了双层PDF质量,以所见即所得的方式生成双层PDF文件。 |
