一种基于概率统计的旅行时间筛选方法

基本信息

申请号 CN201010526019.1 申请日 -
公开(公告)号 CN101976305B 公开(公告)日 2015-05-06
申请公布号 CN101976305B 申请公布日 2015-05-06
分类号 G06Q50/14(2012.01)I 分类 计算;推算;计数;
发明人 冷彪;张琪;徐州川;熊璋 申请(专利权)人 深圳市千方航实科技有限公司
代理机构 北京慧泉知识产权代理有限公司 代理人 王顺荣;唐爱华
地址 100191 北京市海淀区学院路37号北航计算机科学与工程学院
法律状态 -

摘要

摘要 本发明提出了一种基于概率统计的旅行时间筛选方法,乘客旅行时间原数据的筛选方法主要包括以下两层筛选:(1)筛选极端异常数据。将不符合旅行时间分布的计算异常数据筛除,如由于系统错误,乘客的旅行时间小于列车的运行时间,这显然是极端异常数据;由于乘客的特殊旅行目的,如统计客流的工作人员等的旅行时间长达几个小时甚至十几个小时,这也是极端异常数据。应该将这些极端异常数据筛除。(2)筛选统计异常数据。为了工程、理论的需要,在对乘客旅行时间海量数据分析时需要使乘客旅行时间的分布呈现有数学规律的统计分布,需要筛选部分偏离正态分布的数据。