一种基于动态规划技术的复杂文档比较方法

基本信息

申请号 CN202011036551.5 申请日 -
公开(公告)号 CN112307737A 公开(公告)日 2021-02-02
申请公布号 CN112307737A 申请公布日 2021-02-02
分类号 G06F40/194(2020.01)I 分类 计算;推算;计数;
发明人 崔海东;吕玉玺 申请(专利权)人 泰山信息科技有限公司
代理机构 北京高航知识产权代理有限公司 代理人 乔浩刚
地址 271000山东省泰安市泰山区明堂路泰山软件园1-4层
法律状态 -

摘要

摘要 本发明为一种基于动态规划技术的复杂文档比较方法,用于对比文档A及文档B,包括以下步骤:将要比较的两份文档按照区域分成若干份,在每个区域内部,按照区域进行分割,区域的分割根据段落层及元素层,并将相似的段落层进行元素层比较,并得出结果,将步骤3中的结果进行整理形成结果集,对包含有段落、页眉页脚、内嵌文本框等复杂结构的文档,以分区域、分层次的方式将文档进行拆分,按照区域进行对应;对应区域内部包含的文字、图形、图片等复杂元素,进行统一化处理,再结合动态规划算法进行比较,得出差异部分,实现高效的复杂文档比较。