网页获取方法和装置
基本信息
申请号 | CN201310048765.8 | 申请日 | - |
公开(公告)号 | CN103077254B | 公开(公告)日 | 2017-11-03 |
申请公布号 | CN103077254B | 申请公布日 | 2017-11-03 |
分类号 | G06F17/30(2006.01)I | 分类 | 计算;推算;计数; |
发明人 | 于维纬;刘卓 | 申请(专利权)人 | 人民日报媒体技术股份有限公司 |
代理机构 | 北京汇智英财专利代理事务所(普通合伙) | 代理人 | 郑玉洁 |
地址 | 100026 北京市朝阳区金台西路2号【4-2】9号楼321室 | ||
法律状态 | - |
摘要
摘要 | 本申请提供了一种网页获取方法和装置,所述方法包括:确定抓取的网页中的第一中心hub网页;解析出所述第一hub网页中包含的翻页信息,所述翻页信息包括翻页链接地址;根据所述翻页信息,生成与所述第一hub网页相关的第二hub网页地址;根据所述第二hub网页地址,获取内容网页。通过本申请实施例提高了网页获取时的网页覆盖率,使得能够获取更全面的网络信息。 |
