针对快递员周边人群营销中快递员数据的识别方法

基本信息

申请号 CN201410666023.6 申请日 -
公开(公告)号 CN104331502B 公开(公告)日 2018-04-03
申请公布号 CN104331502B 申请公布日 2018-04-03
分类号 G06F17/30;G06Q30/02 分类 计算;推算;计数;
发明人 刘雷;冯先宏 申请(专利权)人 杭州亚信软件有限公司
代理机构 南京天翼专利代理有限责任公司 代理人 杭州亚信软件有限公司
地址 310051 浙江省杭州市滨江区西兴街道江陵路2028号星耀城3幢
法律状态 -

摘要

摘要 本发明公开一种针对快递员周边人群营销中快递员数据的识别方法,其首先从经分数据仓库和流量数据仓库中获取快递员用户基本信息、通信信息和位置信息,并关联形成事实宽表;对事实宽表中的多个样本数据进行正负样本分类,然后以相同正负样本比例将事实宽表中数据分为训练集、验证集;再对训练集正、负样本数据进行预处理,进而利用DTRA算法,生成快递员用户特征规则集,并依据特征规则验证验证集中的正、负样本用户;再利用DTRA算法生成潜在快递员数据;最后进行模型效果评估。本发明通过利用机器学习替代传统人工经验挖掘,提高数据挖掘的准确度,并基于分布式大数据处理平台,实现从传统数据库(Oracle)的抽样挖掘到全量数据挖掘,提升数据挖掘性能。