Web系统的数据资源模型化提取方法、装置以及设备
基本信息
申请号 | CN201910295549.0 | 申请日 | - |
公开(公告)号 | CN110147477B | 公开(公告)日 | 2021-08-27 |
申请公布号 | CN110147477B | 申请公布日 | 2021-08-27 |
分类号 | G06F16/951;G06F40/143;G06F3/0484 | 分类 | 计算;推算;计数; |
发明人 | 张颖;徐经纬;黄罡;苏星;蔡斯博 | 申请(专利权)人 | 因特睿科技有限公司 |
代理机构 | 北京润泽恒知识产权代理有限公司 | 代理人 | 莎日娜 |
地址 | 100080 北京市海淀区北四环西路65号海淀新技术大厦16层1608室 | ||
法律状态 | - |
摘要
摘要 | 本发明涉及通信技术领域,提供了一种Web系统的数据资源模型化提取方法、装置以及设备,旨在解决现有提取方法存在具有较高技术门槛、提取方法复杂的问题。所述Web系统的数据资源模型化提取方法包括:确定用户对Web网页的标记区域;检测所述标记区域对应的Web数据的页面结构类型;获取与所述页面结构类型相匹配的提取模型;根据所述提取模型的模型结构,结构化地输出所述Web数据。使用所述方法后,对于用户,仅需对网页上的某一区域进行标记,客户端会自动进行上述检测页面结构类型、获取提取模型、结构化地输出Web数据等步骤,用户不需要每次在提取数据前进行编辑代码或编辑提取规则等操作,也不需要在每次提取后手动对数据进行结构组织。 |
