一种多页面版式文档的版心识别及对齐方法
基本信息
申请号 | CN201910743323.2 | 申请日 | - |
公开(公告)号 | CN110705224A | 公开(公告)日 | 2020-01-17 |
申请公布号 | CN110705224A | 申请公布日 | 2020-01-17 |
分类号 | G06F40/169 | 分类 | 计算;推算;计数; |
发明人 | 王磊;徐剑波;张诗玉 | 申请(专利权)人 | 北京众信博雅科技有限公司 |
代理机构 | - | 代理人 | - |
地址 | 100000 北京市海淀区西三旗安宁庄路4号9号楼4层0996 | ||
法律状态 | - |
摘要
摘要 | 本发明涉及一种多页面版式文档的版心识别及对齐方法,包括以下步骤:步骤一:解析版式文件,逐页获取页面中文字内容的包围矩阵;步骤二:根据版心的统计数据,对文档进行划分;步骤三:对文档进行奇偶页检查,进行奇偶页偏移计算;步骤四:最后对整个文档的对齐调整,最终形成一个版心对齐的多页面版式文件。 |
