一种企业综合数据的预处理方法

基本信息

申请号 CN201911077743.8 申请日 -
公开(公告)号 CN111104442A 公开(公告)日 2020-05-05
申请公布号 CN111104442A 申请公布日 2020-05-05
分类号 G06F16/25 分类 计算;推算;计数;
发明人 高婧;李依青 申请(专利权)人 杭州绿程网络科技有限公司
代理机构 北京兴智翔达知识产权代理有限公司 代理人 郭卫芹
地址 310000 浙江省杭州市滨江区浦沿街道东冠路555号谷丰大厦18楼1839室
法律状态 -

摘要

摘要 本发明涉及一种企业综合数据的预处理方法,建立多个数据存储库和预处理规则库,将企业数据分类存储,形成数据列表,分别抽样提取每个数据库的数据特征,将数据特征去噪处理,将数据特征离散化处理,形成非线性离散数据特征库,对非线性离散数据进行采样处理,通过采样数据分解形成数据矩阵子集,在数据矩阵的基础上进行数据导入并对预处理结果进行评估。本发明提供的企业综合数据的预处理方法通过不同采集数据的分类建库形成不同的特征参数,通过企业规则库的简历和离散型特征库的形成,能叫方便的对不同种类的数据进行预处理。