网页获取方法和装置

基本信息

申请号 CN201310048765.8 申请日 -
公开(公告)号 CN103077254B 公开(公告)日 2017-11-03
申请公布号 CN103077254B 申请公布日 2017-11-03
分类号 G06F17/30(2006.01)I 分类 计算;推算;计数;
发明人 于维纬;刘卓 申请(专利权)人 人民日报媒体技术股份有限公司
代理机构 北京汇智英财专利代理事务所(普通合伙) 代理人 郑玉洁
地址 100026 北京市朝阳区金台西路2号【4-2】9号楼321室
法律状态 -

摘要

摘要 本申请提供了一种网页获取方法和装置,所述方法包括:确定抓取的网页中的第一中心hub网页;解析出所述第一hub网页中包含的翻页信息,所述翻页信息包括翻页链接地址;根据所述翻页信息,生成与所述第一hub网页相关的第二hub网页地址;根据所述第二hub网页地址,获取内容网页。通过本申请实施例提高了网页获取时的网页覆盖率,使得能够获取更全面的网络信息。