一种多源时序数据的预处理方法和装置

基本信息

申请号 CN201610818702.X 申请日 -
公开(公告)号 CN106446091A 公开(公告)日 2017-02-22
申请公布号 CN106446091A 申请公布日 2017-02-22
分类号 G06F17/30(2006.01)I 分类 计算;推算;计数;
发明人 秦臻;崔岩;沈雷 申请(专利权)人 北京协力筑成科技信息服务股份有限公司
代理机构 - 代理人 -
地址 100080 北京市海淀区海淀西大街34号海置创投6层
法律状态 -

摘要

摘要 本发明提供了一种多源时序数据的预处理方法和装置。所述方法包括:多源时序数据的采集和解析步骤,分别从不同的数据源中获取原始的不同结构的数据,将原始的不同结构的数据转换为具有统一结构的多个时序数据;数据清洗步骤,对所述具有统一结构的多个时序数据进行清洗;针对时序数据特性的预处理步骤,根据时序数据特有的属性,利用描述同一对象的多个时序数据进行相互校验和补充。本发明解决了现有技术中多源时序数据无法被彻底预处理的问题,从而能够获得更完整、可信度更高的结构化时序数据,有利于后续数据分析与预测。