一种招标信息的采集方法

基本信息

申请号 CN201810127175.7 申请日 -
公开(公告)号 CN108415968A 公开(公告)日 2018-08-17
申请公布号 CN108415968A 申请公布日 2018-08-17
分类号 G06F17/30;G06Q30/08 分类 计算;推算;计数;
发明人 陈晨;欧凌冰;龚澄源;郑红辉;刘蕊儿 申请(专利权)人 湖南慧集网络科技有限责任公司
代理机构 广州嘉权专利商标事务所有限公司 代理人 湖南慧集网络科技有限责任公司
地址 410000 湖南省长沙市岳麓区岳麓街道溁左路中南大学科技园研发总部1栋135房
法律状态 -

摘要

摘要 本发明提供了一种招标信息的采集方法,包括步骤:S100)采集招标信息:以各招标网为信息源,获取招标信息公告的网页数据,然后将此网页数据交由网络爬虫进行信息采集;S200)提取招标信息:将网络爬虫采集的网页数据中的广告、友情链接过滤掉,然后抽取网页数据中的有效信息,每个信息定义一个指标,所有的指标组成指标列表;S300)存储招标信息:有效信息使用数据库中的表存储,所提取的每一个指标使用结构化数据库中一列存储,将网页数据、招投标信息媒体来源、所属区域、所述行业、网页发布时间、网页采集时间也分别作为指标,存储于数据库一列。