一种搜集深网数据全集的爬虫方法和系统专利查询专利号|摘要-满商公司网

一种搜集深网数据全集的爬虫方法和系统

基本信息

摘要

摘要	本发明提供一种搜集深网数据全集的爬虫方法和系统，其中，搜集深网数据全集的爬虫方法包括：根据关键词汇进行深网数据搜索，获得查询结果；若所述查询结果溢出，则对所述查询结果进行分词处理获得特征词集合，将所述特征词集合中的每个特征词与上一次搜索中的所述关键词汇进行组合获得多个新关键词汇，根据每个新关键词汇进行深网数据搜索获得所有新关键词汇的全部查询结果；若所述全部查询结果中至少一个所述新关键词汇的查询结果溢出，则继续对溢出的所述新关键词汇的查询结果进行分词处理以及深网数据搜索，直至全部查询结果非溢出。本发明提供的搜集深网数据全集的爬虫方法，可以获得深网数据搜索全集。