一种基于无监督学习的用户行程挖掘方法和装置

基本信息

申请号 CN201710096379.4 申请日 -
公开(公告)号 CN108460057A 公开(公告)日 2018-08-28
申请公布号 CN108460057A 申请公布日 2018-08-28
分类号 G06F17/30;G06K9/62 分类 计算;推算;计数;
发明人 朱杰;王志强;孙家棣 申请(专利权)人 深圳市赛格车圣智联科技有限公司
代理机构 深圳市顺天达专利商标代理有限公司 代理人 郭伟刚
地址 518000 广东省深圳市龙岗区宝龙工业城赛格导航科技园1号制造中心四楼
法律状态 -

摘要

摘要 本发明提供了一种基于无监督学习的用户行程挖掘方法,包括以下步骤:步骤S1、对车载终端上传到数据平台的原始样本集进行处理,选定用于建立用于模型学习的训练样本的特征,组成样本库;以及步骤S2、对样本库使用k均值算法进行聚类分析,得到行程起点和非行程起点集合,从而区分出每一个行程。在本发明中对于用户上传到数据平台的数据,由于其中不包含行程识别码,因此我们采用未知分类标签的无监督学习方式,进行聚类分析,从而得到行程起点集合和非行程起点集合,以区分出车辆行驶的每一个行程,为了能够进一步的分析用户的驾驶行为奠定基础。