一种使用Hadoop的极大频繁子图挖掘方法
基本信息
申请号 | CN201610848220.9 | 申请日 | - |
公开(公告)号 | CN106446161A | 公开(公告)日 | 2017-02-22 |
申请公布号 | CN106446161A | 申请公布日 | 2017-02-22 |
分类号 | G06F17/30(2006.01)I | 分类 | 计算;推算;计数; |
发明人 | 曾智彬;印鉴 | 申请(专利权)人 | 广州智海纵横信息科技有限公司 |
代理机构 | 广州粤高专利商标代理有限公司 | 代理人 | 中山大学;广州中大南沙科技创新产业园有限公司;广州智海纵横信息科技有限公司 |
地址 | 510275 广东省广州市海珠区新港西路135号 | ||
法律状态 | - |
摘要
摘要 | 本发明提供一种使用Hadoop的极大频繁子图挖掘方法,该方法通过使用Hadoop来挖掘极大频繁子图,将频繁子树与候选边结合后,通过已保存的中间结果来判断其是否频繁并产生极大频繁子图,而不需要再次遍历数据库,极大频繁子图极大地降低了输出数量,可以在大数据的情况下挖掘极大频繁子图,同时由于生成的候选集只包括频繁子树及其候选边,降低了运行时间。 |
