一种基于区块链系统的爬虫技术

基本信息

申请号 CN201910249936.0 申请日 -
公开(公告)号 CN109981657A 公开(公告)日 2019-07-05
申请公布号 CN109981657A 申请公布日 2019-07-05
分类号 H04L29/06(2006.01)I; H04L29/08(2006.01)I; G06F16/953(2019.01)I; G06F16/951(2019.01)I 分类 电通信技术;
发明人 梅一多; 孙昊; 马敬东; 朱晓庆 申请(专利权)人 浙江数值跳跃网络科技有限公司
代理机构 南京业腾知识产权代理事务所(特殊普通合伙) 代理人 浙江数值跳跃网络科技有限公司
地址 313200 浙江省湖州市德清县阜溪街道长虹东街926号(莫干山国家高新区)
法律状态 -

摘要

摘要 本发明公开了基于区块链系统的爬虫技术,步骤如下:步骤1:在区块链网络中,在现有节点之上,增加了公钥开放节点;步骤2:当区块链系统中的节点启动后,可以根据自身启动配置,访问附近的公钥开放节点,向其进行公钥信息注册;步骤3:当爬虫启动后,先寻找附近公钥节点,并下载缓存公钥节点信息;步骤4:根据线索信息进行数据爬取;步骤5:系统中爬虫对于节点的爬取采用泛洪算法来进行处理,并设置TTL相应值,当根据线索信息进行深入爬取时,如果超过TTL设定值的话,就终止该线索的爬取。本发明主要用于区块链系统中,极大的发挥区块链存储特点,有利于区块链应用的发展。