用于确定内容节点的方法与设备
基本信息
申请号 | CN201811645127.3 | 申请日 | - |
公开(公告)号 | CN109710833A | 公开(公告)日 | 2021-07-16 |
申请公布号 | CN109710833A | 申请公布日 | 2021-07-16 |
分类号 | G06F16/951 | 分类 | 计算;推算;计数; |
发明人 | 翟光景;田进太;赵庆平;刘益东 | 申请(专利权)人 | 上海蜜度信息技术有限公司 |
代理机构 | 上海百一领御专利代理事务所(普通合伙) | 代理人 | 王奎宇;甘章乖 |
地址 | 201800 上海市嘉定区安亭镇杭桂路1112号8层J71室 | ||
法律状态 | - |
摘要
摘要 | 本申请的目的是提供一种用于确定内容节点的方法与设备。与现有技术相比,本申请通过获取目标文档对应的初级子节点集合,然后基于所述初级子节点集合,确定初级容器类节点,并基于所述初级容器类节点,确定各次级容器类节点及对应的相关疑似内容节点,然后基于所述对应的相关疑似内容节点,确定内容节点。通过这种方式,能够自动确定出内容节点,从而更快地实现内容抽取,而且,还能够避免遗漏相关疑似内容节点,进而提高内容节点确定的准确性。 |
