一种电子文档结构化处理的方法和系统
基本信息
申请号 | CN201110141420.8 | 申请日 | - |
公开(公告)号 | CN102479248A | 公开(公告)日 | 2012-05-30 |
申请公布号 | CN102479248A | 申请公布日 | 2012-05-30 |
分类号 | G06F17/30(2006.01)I;G06F17/24(2006.01)I | 分类 | 计算;推算;计数; |
发明人 | 张训军 | 申请(专利权)人 | 北京中科希望软件股份有限公司 |
代理机构 | - | 代理人 | - |
地址 | 100190 北京市海淀区中关村大街22号中科大厦10层 | ||
法律状态 | - |
摘要
摘要 | 本发明涉及数字出版领域,特别涉及一种电子文档处理技术,提出了一种电子文档结构化处理的方法和系统,所述方法包括如下步骤:步骤S1,制定对所述电子文档进行结构化处理的标签结构;步骤S2,段落样式识别,获取所述电子文档的段落样式信息;步骤S3,将所述段落样式信息与所述结构标签进行匹配;步骤S4,根据所述结构标签构造标签的层次关系。本发明有效克服了现有技术无法自动为文档添加标签、不能体现文档的层次关系、处理效率低的问题。 |
