Web系统的数据资源模型化提取方法、装置以及设备

基本信息

申请号 CN201910295549.0 申请日 -
公开(公告)号 CN110147477A 公开(公告)日 2019-08-20
申请公布号 CN110147477A 申请公布日 2019-08-20
分类号 G06F16/951;G06F17/22;G06F3/0484 分类 计算;推算;计数;
发明人 张颖;徐经纬;黄罡;苏星;蔡斯博 申请(专利权)人 因特睿科技有限公司
代理机构 北京润泽恒知识产权代理有限公司 代理人 北京因特睿软件有限公司
地址 100080 北京市海淀区北四环西路65号海淀新技术大厦16层1608室
法律状态 -

摘要

摘要 本发明涉及通信技术领域,提供了一种Web系统的数据资源模型化提取方法、装置以及设备,旨在解决现有提取方法存在具有较高技术门槛、提取方法复杂的问题。所述Web系统的数据资源模型化提取方法包括:确定用户对Web网页的标记区域;检测所述标记区域对应的Web数据的页面结构类型;获取与所述页面结构类型相匹配的提取模型;根据所述提取模型的模型结构,结构化地输出所述Web数据。使用所述方法后,对于用户,仅需对网页上的某一区域进行标记,客户端会自动进行上述检测页面结构类型、获取提取模型、结构化地输出Web数据等步骤,用户不需要每次在提取数据前进行编辑代码或编辑提取规则等操作,也不需要在每次提取后手动对数据进行结构组织。