一种使用Hadoop的极大频繁子图挖掘方法

基本信息

申请号 CN201610848220.9 申请日 -
公开(公告)号 CN106446161A 公开(公告)日 2017-02-22
申请公布号 CN106446161A 申请公布日 2017-02-22
分类号 G06F17/30(2006.01)I 分类 计算;推算;计数;
发明人 曾智彬;印鉴 申请(专利权)人 广州智海纵横信息科技有限公司
代理机构 广州粤高专利商标代理有限公司 代理人 中山大学;广州中大南沙科技创新产业园有限公司;广州智海纵横信息科技有限公司
地址 510275 广东省广州市海珠区新港西路135号
法律状态 -

摘要

摘要 本发明提供一种使用Hadoop的极大频繁子图挖掘方法,该方法通过使用Hadoop来挖掘极大频繁子图,将频繁子树与候选边结合后,通过已保存的中间结果来判断其是否频繁并产生极大频繁子图,而不需要再次遍历数据库,极大频繁子图极大地降低了输出数量,可以在大数据的情况下挖掘极大频繁子图,同时由于生成的候选集只包括频繁子树及其候选边,降低了运行时间。