一种基于Hadoop平台MapReduce环境下的隐私保护方法

基本信息

申请号 CN202010805039.6 申请日 -
公开(公告)号 CN111737759B 公开(公告)日 2021-10-08
申请公布号 CN111737759B 申请公布日 2021-10-08
分类号 G06F21/62;G06F16/22;G06F16/27;G06F16/25;G06F16/13;G06F16/182;G06K9/62 分类 计算;推算;计数;
发明人 李鹏;王璇璇;徐鹤;王汝传;樊卫北;朱枫;程海涛;蓝东婉;李友涛;张结魁 申请(专利权)人 安徽晶奇网络科技股份有限公司
代理机构 南京正联知识产权代理有限公司 代理人 王素琴
地址 210009 江苏省南京市新模范马路66号
法律状态 -

摘要

摘要 针对在分布式环境下海量数据在运算处理的过程中容易遇到数据泄露以及恶意分析的问题,本发明提出一种基于Hadoop平台MapReduce环境下的隐私保护方法,该方法通过使用Hadoop集群中的MapReduce技术,结合随机抽取记录的方式,将数据集分配到各个节点,并启动Map分任务进行数据的整合处理。Reduce分任务通过使用指数机制完成属性的选择与更新,最后对叶子节点添加随机噪声,使得分类的结果满足差分隐私。该方法在保证数据可用性的同时也具有较好的分类准确率。