一种基于改进PrefixSpan算法的交易数据频繁序列模式挖掘方法
基本信息
申请号 | CN202110777271.8 | 申请日 | - |
公开(公告)号 | CN113505156A | 公开(公告)日 | 2021-10-15 |
申请公布号 | CN113505156A | 申请公布日 | 2021-10-15 |
分类号 | G06F16/2458(2019.01)I;G06F16/242(2019.01)I;G06F16/2453(2019.01)I;G06F16/215(2019.01)I;G06F16/22(2019.01)I;G06Q30/02(2012.01)I | 分类 | 计算;推算;计数; |
发明人 | 何新;王子龙;陈琛 | 申请(专利权)人 | 南京荣新智能科技有限公司 |
代理机构 | 北京科亿知识产权代理事务所(普通合伙) | 代理人 | 李兴林 |
地址 | 210000江苏省南京市秦淮区光华路162号 | ||
法律状态 | - |
摘要
摘要 | 本发明公开了一种基于改进PrefixSpan算法的交易数据频繁序列模式挖掘方法,包括步骤:对商品交易数据进行预处理,得到商品交易数据集,并存入交易序列数据库中;扫描交易序列数据库,对每个单项进行计数,得到每个单项的序列支持度并降序排列,选出前μ项且满足最小支持度的单项作为初始前缀;采取深度优先遍历,对第一个初始前缀的位置进行计算,并保存在前缀位置信息表中,生成商品交易投影数据库;再对其进行迭代,直至无法生成新的商品交易投影数据库,保存每个商品交易投影数据库生成的频繁序列模式集合;从第二个初始前缀开始,重复上一步骤,直至所有初始前缀均计算完毕。本发明用于减少交易数据频繁序列模式挖掘的时间/空间消耗,提高执行效率。 |
