一种用户实际访问网址的识别方法及装置

基本信息

申请号 CN202010467463.4 申请日 -
公开(公告)号 CN111611508A 公开(公告)日 2020-09-01
申请公布号 CN111611508A 申请公布日 2020-09-01
分类号 G06F16/955(2019.01)I 分类 计算;推算;计数;
发明人 翟欣虎;秦益飞;杨正权 申请(专利权)人 江苏易安联网络技术有限公司
代理机构 无锡市汇诚永信专利代理事务所(普通合伙) 代理人 江苏易安联网络技术有限公司
地址 211100江苏省南京市江宁区秣陵街道秣周东路12号悠谷孵化器4楼401室
法律状态 -

摘要

摘要 本发明提供了一种用户实际访问网址的识别方法,包括如下步骤:S01、收集服务器上产生的用户日志;S02、按第一特征进行分组;S03、将每一组的用户日志按第二特征进行排序;S04、将已经排好序的每一组用户日志,按第一合并规则合并为若干小组,每一小组内的用户日志归并为该用户一次访问所产生的请求日志;S05、对于已经分好的一次访问产生的若干条请求日志,按第二规则构建多叉树,遍历这些请求日志,构建出一棵或者多棵多叉树;S06、统计上述一棵或者多棵多叉树的叶子节点的数量,选出其中叶子节点最多的树的根节点作为该用户当时实际访问的网站地址;S07、重复上述步骤,即可识别出用户实际访问的网址。该发明具有准确性高、实时性高的优点。