用户群体的分类方法、装置、存储介质及计算机设备
基本信息
申请号 | CN202111412279.0 | 申请日 | - |
公开(公告)号 | CN113836370B | 公开(公告)日 | 2022-03-01 |
申请公布号 | CN113836370B | 申请公布日 | 2022-03-01 |
分类号 | G06F16/9035(2019.01)I;G06F16/906(2019.01)I;G06N20/00(2019.01)I | 分类 | 计算;推算;计数; |
发明人 | 陶景龙;王启凡;魏国富;殷钱安;余贤喆;周晓勇;梁淑云;刘胜;马影 | 申请(专利权)人 | 上海观安信息技术股份有限公司 |
代理机构 | 北京中强智尚知识产权代理有限公司 | 代理人 | 黄耀威 |
地址 | 200000上海市浦东新区泥城镇云端路1412弄15号二层1室 | ||
法律状态 | - |
摘要
摘要 | 本发明公开了一种用户群体的分类方法、装置、存储介质及计算机设备。其中方法包括:获取用户群体的行为数据,并对用户群体的行为数据进行预处理,得到以每个用户的用户名为主体对象的行为序列数据集;利用关联分析算法,对行为序列数据集中的频繁行为指令组合进行提取和频次统计,得到频繁指令组合特征表;通过序列对比算法,计算行为序列数据集中的各个行为序列之间的序列匹配分值和序列间相似度分值,得到序列相似性特征表;对行为序列数据集中的行为指令进行频次统计,得到行为指令频次特征表;采用半监督分类算法,对频繁指令组合特征表、序列相似性特征表和行为指令频次特征表进行分类分析,得到具有不同类别的用户群体,以提高分类效率。 |
