区域增量高新技术企业预测模型的建立方法

基本信息

申请号 CN202011583412.4 申请日 -
公开(公告)号 CN112685891A 公开(公告)日 2021-04-20
申请公布号 CN112685891A 申请公布日 2021-04-20
分类号 G06F16/215(2019.01)I;G06F16/951(2019.01)I;G06F30/20(2020.01)I;G06Q10/06(2012.01)I;G06F16/2457(2019.01)I 分类 计算;推算;计数;
发明人 费红琳;孙秀婷;胡幼华;鄢雄伟;丁杰 申请(专利权)人 广州博士信息技术研究院有限公司
代理机构 广州博士科创知识产权代理有限公司 代理人 李永锋
地址 510000广东省广州市高新技术产业开发区科学城科珠路203号1201D
法律状态 -

摘要

摘要 本发明提供一种区域增量高新技术企业预测模型的建立方法,包括以下步骤:S1)、利用爬虫技术通过企业名称爬取相应的数据并导入到数据库;S2)、利用企业注册地址进行数据字段清洗;S3)、利用数据成立年度过滤筛选数据;S4)、利用数据行业过滤筛选数据;S5)、对已经申报过高新技术企业数据进行过滤;S6)、对企业知识产权信息进行更新;S7)、判断知识产权信息是否符合潜在高新技术企业条件;S8)、模型建立并获取增量高新技术企业。本发明利用爬虫技术获取数据,同时利用根据企业注册地址来清洗并获得企业的省、市、区等字段信息;本发明通过成立年度、行业过滤、是否申报高企、知识产权、财务等信息对企业进行筛选。