一种基于改进PrefixSpan算法的交易数据频繁序列模式挖掘方法

基本信息

申请号 CN202110777271.8 申请日 -
公开(公告)号 CN113505156A 公开(公告)日 2021-10-15
申请公布号 CN113505156A 申请公布日 2021-10-15
分类号 G06F16/2458(2019.01)I;G06F16/242(2019.01)I;G06F16/2453(2019.01)I;G06F16/215(2019.01)I;G06F16/22(2019.01)I;G06Q30/02(2012.01)I 分类 计算;推算;计数;
发明人 何新;王子龙;陈琛 申请(专利权)人 南京荣新智能科技有限公司
代理机构 北京科亿知识产权代理事务所(普通合伙) 代理人 李兴林
地址 210000江苏省南京市秦淮区光华路162号
法律状态 -

摘要

摘要 本发明公开了一种基于改进PrefixSpan算法的交易数据频繁序列模式挖掘方法,包括步骤:对商品交易数据进行预处理,得到商品交易数据集,并存入交易序列数据库中;扫描交易序列数据库,对每个单项进行计数,得到每个单项的序列支持度并降序排列,选出前μ项且满足最小支持度的单项作为初始前缀;采取深度优先遍历,对第一个初始前缀的位置进行计算,并保存在前缀位置信息表中,生成商品交易投影数据库;再对其进行迭代,直至无法生成新的商品交易投影数据库,保存每个商品交易投影数据库生成的频繁序列模式集合;从第二个初始前缀开始,重复上一步骤,直至所有初始前缀均计算完毕。本发明用于减少交易数据频繁序列模式挖掘的时间/空间消耗,提高执行效率。