一种用户上网偏好数据识别方法

基本信息

申请号 CN201410664717.6 申请日 -
公开(公告)号 CN104462245A 公开(公告)日 2015-03-25
申请公布号 CN104462245A 申请公布日 2015-03-25
分类号 G06F17/30(2006.01)I 分类 计算;推算;计数;
发明人 刘雷 申请(专利权)人 南京亚信软件有限公司
代理机构 南京天翼专利代理有限责任公司 代理人 亚信科技(南京)有限公司;南京亚信软件有限公司
地址 210013 江苏省南京市定淮门12号16号楼
法律状态 -

摘要

摘要 本发明公开一种用户上网偏好数据识别方法,通过利用现有的中位数概念、H-index算法,根据用户的上网行为特征,对用户的偏好进行偏好、偏好度识别,提高数据识别的准确度和识别效率。方法首先将获取到的用户上网行为日志数据根据不同应用进行分别汇总,然后指定各应用的指标类型,并取出各指标的最大值和最小值,再通过偏好挖掘算法根据最大值与最小值算出变异系数,然后分别对各不同应用的不同指标值进行标准化指标值,根据标准化的值计算各不同应用偏好度,根据偏好度数值高低对各应用进行排序,从排序后的各应用中选取偏好度居中的应用偏好度作为中位数;将偏好度大于中位数的应用添加至偏好度排名中,最后根据H-index算法给用户打上偏好度标签。