一种无中心的分布式互联网信息推送式采集系统
基本信息
申请号 | CN202210414450.X | 申请日 | - |
公开(公告)号 | CN114745430A | 公开(公告)日 | 2022-07-12 |
申请公布号 | CN114745430A | 申请公布日 | 2022-07-12 |
分类号 | H04L67/55(2022.01)I;H04L69/16(2022.01)I;H04L67/02(2022.01)I | 分类 | 电通信技术; |
发明人 | 岳洋;陈德全 | 申请(专利权)人 | 盟浪可持续数字科技(深圳)有限责任公司 |
代理机构 | 深圳市博太联众专利代理事务所(特殊普通合伙) | 代理人 | - |
地址 | 518000广东省深圳市前海深港合作区前湾一路1号A栋201室(入驻深圳市前海商务秘书有限公司) | ||
法律状态 | - |
摘要
摘要 | 本发明提供一种无中心的分布式互联网信息推送式采集系统,涉及互联网领域。该无中心的分布式互联网信息推送式采集系统,包括分布式系统构建、添加任务、单一节点运行流程、多节点协同。通过抛弃了传统的主动抓取技术,采用消息推送机制,实现了目标网站向抓取系统主动推送信息的方式完成信息采集,当关注的消息网站有任何新内容出现后,触发网站推送事件,通过已经构建的推送通道,将信息推送到抓取系统后台的接收端,通过这样的方式,减少了主动抓取的成本,降低了被目标网站封禁的可能,提高了信息更新的及时性,将信息采集方式由主动爬取变为目标网站主动推送,降低信息采集的设备和网络成本,提高采集时效性,杜绝被目标网站拦截的可能。 |
