一种调研数据清洗方法及系统
基本信息
申请号 | CN202110680118.3 | 申请日 | - |
公开(公告)号 | CN113326254A | 公开(公告)日 | 2021-08-31 |
申请公布号 | CN113326254A | 申请公布日 | 2021-08-31 |
分类号 | G06F16/215(2019.01)I;G06Q30/02(2012.01)I | 分类 | 计算;推算;计数; |
发明人 | 张鸿翔;张仲芳;杨艳;徐颖 | 申请(专利权)人 | 立信(重庆)数据科技股份有限公司 |
代理机构 | 重庆强大凯创专利代理事务所(普通合伙) | 代理人 | 冉剑侠 |
地址 | 401120重庆市渝北区仙桃数据谷东路19号 | ||
法律状态 | - |
摘要
摘要 | 本发明属于数据处理领域,具体涉及一种调研数据清洗方法及系统,该系统包括识别单元、单指标审核单元、多指标审核单元及单人数据审核单元;识别单元用于识别调研数据的填写人身份、数据属性、数据间的逻辑关系及数据间的权重关联性;单指标审核单元用于对数据属性相同的调研数据进行统一审核,判断调研数据是否符合数据属性要求;多指标审核单元用于根据数据间的逻辑关系,对存在逻辑关系的调研数据进行审核,判断是否有存在逻辑矛盾的调研数据;单人数据审核单元用于根据数据间的权重关联性,对相同的填写人身份的所有数据进行审核,分析是否存在内容不合理的调研数据。本申请能够保证存储的调研数据的质量。 |
