一种招标信息的采集方法
基本信息
申请号 | CN201810127175.7 | 申请日 | - |
公开(公告)号 | CN108415968A | 公开(公告)日 | 2018-08-17 |
申请公布号 | CN108415968A | 申请公布日 | 2018-08-17 |
分类号 | G06F17/30;G06Q30/08 | 分类 | 计算;推算;计数; |
发明人 | 陈晨;欧凌冰;龚澄源;郑红辉;刘蕊儿 | 申请(专利权)人 | 湖南慧集网络科技有限责任公司 |
代理机构 | 广州嘉权专利商标事务所有限公司 | 代理人 | 湖南慧集网络科技有限责任公司 |
地址 | 410000 湖南省长沙市岳麓区岳麓街道溁左路中南大学科技园研发总部1栋135房 | ||
法律状态 | - |
摘要
摘要 | 本发明提供了一种招标信息的采集方法,包括步骤:S100)采集招标信息:以各招标网为信息源,获取招标信息公告的网页数据,然后将此网页数据交由网络爬虫进行信息采集;S200)提取招标信息:将网络爬虫采集的网页数据中的广告、友情链接过滤掉,然后抽取网页数据中的有效信息,每个信息定义一个指标,所有的指标组成指标列表;S300)存储招标信息:有效信息使用数据库中的表存储,所提取的每一个指标使用结构化数据库中一列存储,将网页数据、招投标信息媒体来源、所属区域、所述行业、网页发布时间、网页采集时间也分别作为指标,存储于数据库一列。 |
