一种大数据环境下的数据挖掘方法和装置

基本信息

申请号 CN201510249652.3 申请日 -
公开(公告)号 CN104809244B 公开(公告)日 2018-02-09
申请公布号 CN104809244B 申请公布日 2018-02-09
分类号 G06F17/30 分类 计算;推算;计数;
发明人 马泳宇 申请(专利权)人 深圳市富道信息科技有限公司
代理机构 北京天奇智新知识产权代理有限公司 代理人 成都睿峰科技有限公司;深圳市富道信息科技有限公司
地址 610041 四川省成都市高新区天府大道北段1480号拉德方斯大厦东楼10层
法律状态 -

摘要

摘要 本发明提出了一种大数据环境下的数据挖掘方法,包括:步骤S100,大数据预处理;步骤S200,大数据切分和管理;步骤S300,建立聚类用的超图模型;步骤S400,大数据映射,具体是将切分后的数据块分别映射到超图H=(V,E),即每个数据块映射到一个超图;步骤S500,利用超图对每个数据块分别进行聚类处理;步骤S600,对步骤S500得到的每个数据块的聚类结果进行再次聚类,得到最终的聚类结果。本发明利用云平台结合超图理论对大数据进行挖掘聚类处理,实现了大数据分析处理的快速、实时、准确。