多文件格式版式文档的对比方法

基本信息

申请号 CN202011530649.6 申请日 -
公开(公告)号 CN112395852A 公开(公告)日 2021-02-23
申请公布号 CN112395852A 申请公布日 2021-02-23
分类号 G06F40/194(2020.01)I;G06F40/106(2020.01)I 分类 计算;推算;计数;
发明人 章杰;刘绍军 申请(专利权)人 江西金格科技有限公司
代理机构 - 代理人 -
地址 330096江西省南昌市高新区火炬大街579号绿悦科技大厦15楼
法律状态 -

摘要

摘要 本发明公开了一种多文件格式版式文档的对比方法,文档元素提取环节是依据不同版式文档格式的标准作为参考,对标准版式文档的格式解析与内容读取,并将最终解析出来的数据内容作为文档元素抽象环节的输入数据;按上述输入数据将文档中的主要图元元素抽象转换为自定义的文档图元结构,并将抽象后的文档图元结构数据以不同后缀类型的文件分类保存;文档内容对比环节按照文件后缀名分类,逐类型地进行图元抽象文件的读取与对比操作,且将对比结果作为文档差异输出环节的输入数据,对差异结果进行汇总、合并与展示。提供了一个弹性的质量效果衡量工具,解决了当前人工检测文档转换质量所存在的检测效率与准确性低下的弊端。