一种基于数据压缩Apriori算法的关联规则挖掘方法

基本信息

申请号 CN201110430528.9 申请日 -
公开(公告)号 CN103176976B 公开(公告)日 2016-01-20
申请公布号 CN103176976B 申请公布日 2016-01-20
分类号 G06F17/30(2006.01)I 分类 计算;推算;计数;
发明人 高海洋;沈强;张轩溢;唐朝伟;赵志军;慈松;唐晖 申请(专利权)人 无锡中科智能信息处理研发中心有限公司
代理机构 北京法思腾知识产权代理有限公司 代理人 中国科学院声学研究所;无锡中科智能信息处理研发中心有限公司
地址 100190 北京市海淀区北四环西路21号
法律状态 -

摘要

摘要 一种基于数据压缩Apriori算法的关联规则挖掘方法,包括步骤:判断数据库中的事物记录条数N大于该数据库中所有数据项的所有可能的组合数M时,生成数据库项与该数据项数量的映射表DB_Map_Table;将该映射表DB_Map_Table中的所有健值对<key,value>按照key的大小升序排列;使用Apriori算法生成I(I>2)项候选集时,判断将要合并的两个频繁集中不同的项所组成的二项集是否为2项频繁集的子集,如果是,则将将要合并的两个频繁集的合集加入候选集。本发明的效果在于,减小了原有事务数据库的大小,减少了数据库的扫描次数,减少了算法运行过程中候选集的生成,从而在保证算法正确的同时有效地提高了算法的速度和效率。