一种铁路主数据的清洗方法
基本信息
申请号 | CN201510498531.2 | 申请日 | - |
公开(公告)号 | CN105183949B | 公开(公告)日 | 2019-03-19 |
申请公布号 | CN105183949B | 申请公布日 | 2019-03-19 |
分类号 | G06F17/50(2006.01)I | 分类 | 计算;推算;计数; |
发明人 | 李平; 史天运; 王英杰; 马小宁; 邹丹; 刘彦军; 刘军; 王虎; 杨连报; 潘佩芬; 卢瑞珊; 刘俊 | 申请(专利权)人 | 铁科华铁经纬(天津)信息技术有限公司 |
代理机构 | 北京路浩知识产权代理有限公司 | 代理人 | 中国铁道科学研究院;中国铁道科学研究院电子计算技术研究所;北京经纬信息技术公司;中国铁道科学研究院集团有限公司;中国铁道科学研究院集团有限公司电子计算技术研究所;北京经纬信息技术有限公司 |
地址 | 100081 北京市海淀区大柳树路2号 | ||
法律状态 | - |
摘要
摘要 | 本发明提供了一种铁路主数据的清洗方法,该方法包括:构建铁路主数据属性模型;接收导入数据属性模型的导入数据;对导入数据的编码数据进行唯一性检验;根据预设的编码规则,对通过唯一性检验的导入数据中的编码数据,利用正值表达式方式进行数据格式验证;将通过数据格式验证的编码数据写入主数据属性模型,并将存在空缺值、错误值或冲突值的错误数据作为异常编码数据进行记录;对主数据属性模型中编码数据的变化状态进行记录,绘制编码数据的变化轨迹,以实现编码数据的管理。本发明大大提高了数据清洗的准确度,降低了数据清洗的成本,使导入的数据和已有数据保持一致,提高数据的共享性。 |
