商务数据匿名发布中的极小信息损失控制方法
基本信息
申请号 | CN201510202460.7 | 申请日 | - |
公开(公告)号 | CN104766020B | 公开(公告)日 | 2017-08-01 |
申请公布号 | CN104766020B | 申请公布日 | 2017-08-01 |
分类号 | G06F21/60(2013.01)I;G06Q30/00(2012.01)I | 分类 | 计算;推算;计数; |
发明人 | 李先贤;陈刘华;刘鹏;王利娥;辛如意 | 申请(专利权)人 | 北京睿航至臻科技有限公司 |
代理机构 | 桂林市持衡专利商标事务所有限公司 | 代理人 | 广西师范大学 |
地址 | 541004 广西壮族自治区桂林市育才路15号 | ||
法律状态 | - |
摘要
摘要 | 本发明公开商务数据匿名发布中的极小信息损失控制方法,先将数据集泛化所有的非敏感项目至最高层次结点。再对泛化之后的数据集做隐私检查;如果置信度大于隐私约束条件ρ,则部分删除处理当前数据集。在部分删除处理时不断调用隐私检查,直至当前数据集符合数据隐私保护匿名条件时停止,将符合隐私保护匿名要求的当前数据集传送给极小信息控制机制,通过前后信息损失对比决定是否向下进行分组和细化,如果根据分组细化处理后信息损失小,则向下分组细化处理,同时将一个组形成的多个子分组迭代上述过程。但是如果分组细化进行后,信息损失反而增大,则直接发布当前分组。 |
