区域增量高新技术企业预测模型的建立方法
基本信息
申请号 | CN202011583412.4 | 申请日 | - |
公开(公告)号 | CN112685891A | 公开(公告)日 | 2021-04-20 |
申请公布号 | CN112685891A | 申请公布日 | 2021-04-20 |
分类号 | G06F16/215(2019.01)I;G06F16/951(2019.01)I;G06F30/20(2020.01)I;G06Q10/06(2012.01)I;G06F16/2457(2019.01)I | 分类 | 计算;推算;计数; |
发明人 | 费红琳;孙秀婷;胡幼华;鄢雄伟;丁杰 | 申请(专利权)人 | 广州博士信息技术研究院有限公司 |
代理机构 | 广州博士科创知识产权代理有限公司 | 代理人 | 李永锋 |
地址 | 510000广东省广州市高新技术产业开发区科学城科珠路203号1201D | ||
法律状态 | - |
摘要
摘要 | 本发明提供一种区域增量高新技术企业预测模型的建立方法,包括以下步骤:S1)、利用爬虫技术通过企业名称爬取相应的数据并导入到数据库;S2)、利用企业注册地址进行数据字段清洗;S3)、利用数据成立年度过滤筛选数据;S4)、利用数据行业过滤筛选数据;S5)、对已经申报过高新技术企业数据进行过滤;S6)、对企业知识产权信息进行更新;S7)、判断知识产权信息是否符合潜在高新技术企业条件;S8)、模型建立并获取增量高新技术企业。本发明利用爬虫技术获取数据,同时利用根据企业注册地址来清洗并获得企业的省、市、区等字段信息;本发明通过成立年度、行业过滤、是否申报高企、知识产权、财务等信息对企业进行筛选。 |
