一种检测伪周期性访问行为的方法及装置

基本信息

申请号 CN201811084462.0 申请日 -
公开(公告)号 CN110912860B 公开(公告)日 2022-02-18
申请公布号 CN110912860B 申请公布日 2022-02-18
分类号 H04L9/40(2022.01)ICN 103684910 A,2014.03.26;CN 105847283 A,2016.08.10;CN 105224691 A,2016.01.06;CN 106302350 A,2017.01.04;CN 107463904 A,2017.12.12;CN 106156055 A,2016.11.23;CN 105978897 A,2016.09.28;US 2017093907 A1,2017.03.30;US 2018152464 A1,2018.05.31;US 2016134641 A1,2016.05.12;US 9882927 B1,2018.01.30 张玲等.“基于自相关获取周期的时间序列模式挖掘算法”.《信息工程大学学报》.2015,第16卷(第2期),;Yi Xie等.“A Large-Scale Hidden Semi-Markov Model for Anomaly Detection on User Browsing Behaviors”.《IEEE/ACM Transactions on Networking》.2009,第17卷(第1期), 分类 电通信技术;
发明人 刘鑫琪;丛磊 申请(专利权)人 北京数安鑫云信息技术有限公司
代理机构 北京名华博信知识产权代理有限公司 代理人 白莹;苗源
地址 100015北京市朝阳区酒仙桥北路甲10号院201号楼5层505内02
法律状态 -

摘要

摘要 本发明公开了一种检测伪周期性访问行为的方法及装置。所公开的方法包括:获取用户在指定时间段内的访问路径序列、以及与访问路径序列对应的访问时间戳序列;计算不同访问路径延迟序列与访问路径序列之间的各个第一延迟自相关系数,组成第一延迟自相关系数序列;基于时间戳序列计算时间差序列,计算不同时间差延迟序列与时间差序列之间的各个第二延迟自相关系数,组成第二延迟自相关系数序列;当第一延迟自相关系数序列的周期大于或等于第二延迟自相关系数序列的周期时,确定用户具有伪周期性访问行为。所公开的技术方案能够自动检测伪周期性的访问行为,进而将所检测出的访问行为确定为爬虫行为或其它非法网络行为。