关联分析方法和装置

基本信息

申请号 CN201610096728.8 申请日 -
公开(公告)号 CN107102999B 公开(公告)日 2021-09-10
申请公布号 CN107102999B 申请公布日 2021-09-10
分类号 G06F16/2455 分类 计算;推算;计数;
发明人 代斌;杨旭;姜晓燕;蔡宁;王少萌 申请(专利权)人 浙江天猫技术有限公司
代理机构 北京市惠诚律师事务所 代理人 刘子敬
地址 浙江省杭州市余杭区五常街道文一西路969号3幢5层507室
法律状态 -

摘要

摘要 本发明提供了关联分析方法和装置,通过将原始数据库划分为相互之间不贡献频繁项集支持度的各投影数据库,由各节点分别对所对应的投影数据库进行序列模式的关联分析,然后对各节点获得的局部频繁项集以及对应支持度进行汇总。由于所建立的投影数据库相互之间不贡献频繁项集的支持度,可以由不同节点分别对不同的投影数据库进行包括剪枝步骤在内的关联挖掘,各节点所获得的为数据量较小的局部频繁项集,避免现有技术中需要传输各节点未经过剪枝步骤所获得的数据量较大的局部候选频繁项集的情况,从而节省了传输开销,提高了效率。