一种基于数据压缩Apriori算法的关联规则挖掘方法
基本信息
申请号 | CN201110430528.9 | 申请日 | - |
公开(公告)号 | CN103176976B | 公开(公告)日 | 2016-01-20 |
申请公布号 | CN103176976B | 申请公布日 | 2016-01-20 |
分类号 | G06F17/30(2006.01)I | 分类 | 计算;推算;计数; |
发明人 | 高海洋;沈强;张轩溢;唐朝伟;赵志军;慈松;唐晖 | 申请(专利权)人 | 无锡中科智能信息处理研发中心有限公司 |
代理机构 | 北京法思腾知识产权代理有限公司 | 代理人 | 中国科学院声学研究所;无锡中科智能信息处理研发中心有限公司 |
地址 | 100190 北京市海淀区北四环西路21号 | ||
法律状态 | - |
摘要
摘要 | 一种基于数据压缩Apriori算法的关联规则挖掘方法,包括步骤:判断数据库中的事物记录条数N大于该数据库中所有数据项的所有可能的组合数M时,生成数据库项与该数据项数量的映射表DB_Map_Table;将该映射表DB_Map_Table中的所有健值对<key,value>按照key的大小升序排列;使用Apriori算法生成I(I>2)项候选集时,判断将要合并的两个频繁集中不同的项所组成的二项集是否为2项频繁集的子集,如果是,则将将要合并的两个频繁集的合集加入候选集。本发明的效果在于,减小了原有事务数据库的大小,减少了数据库的扫描次数,减少了算法运行过程中候选集的生成,从而在保证算法正确的同时有效地提高了算法的速度和效率。 |
