一种铁路主数据的清洗方法

基本信息

申请号 CN201510498531.2 申请日 -
公开(公告)号 CN105183949B 公开(公告)日 2019-03-19
申请公布号 CN105183949B 申请公布日 2019-03-19
分类号 G06F17/50(2006.01)I 分类 计算;推算;计数;
发明人 李平; 史天运; 王英杰; 马小宁; 邹丹; 刘彦军; 刘军; 王虎; 杨连报; 潘佩芬; 卢瑞珊; 刘俊 申请(专利权)人 铁科华铁经纬(天津)信息技术有限公司
代理机构 北京路浩知识产权代理有限公司 代理人 中国铁道科学研究院;中国铁道科学研究院电子计算技术研究所;北京经纬信息技术公司;中国铁道科学研究院集团有限公司;中国铁道科学研究院集团有限公司电子计算技术研究所;北京经纬信息技术有限公司
地址 100081 北京市海淀区大柳树路2号
法律状态 -

摘要

摘要 本发明提供了一种铁路主数据的清洗方法,该方法包括:构建铁路主数据属性模型;接收导入数据属性模型的导入数据;对导入数据的编码数据进行唯一性检验;根据预设的编码规则,对通过唯一性检验的导入数据中的编码数据,利用正值表达式方式进行数据格式验证;将通过数据格式验证的编码数据写入主数据属性模型,并将存在空缺值、错误值或冲突值的错误数据作为异常编码数据进行记录;对主数据属性模型中编码数据的变化状态进行记录,绘制编码数据的变化轨迹,以实现编码数据的管理。本发明大大提高了数据清洗的准确度,降低了数据清洗的成本,使导入的数据和已有数据保持一致,提高数据的共享性。