商务数据匿名发布中的极小信息损失控制方法

基本信息

申请号 CN201510202460.7 申请日 -
公开(公告)号 CN104766020B 公开(公告)日 2017-08-01
申请公布号 CN104766020B 申请公布日 2017-08-01
分类号 G06F21/60(2013.01)I;G06Q30/00(2012.01)I 分类 计算;推算;计数;
发明人 李先贤;陈刘华;刘鹏;王利娥;辛如意 申请(专利权)人 北京睿航至臻科技有限公司
代理机构 桂林市持衡专利商标事务所有限公司 代理人 广西师范大学
地址 541004 广西壮族自治区桂林市育才路15号
法律状态 -

摘要

摘要 本发明公开商务数据匿名发布中的极小信息损失控制方法,先将数据集泛化所有的非敏感项目至最高层次结点。再对泛化之后的数据集做隐私检查;如果置信度大于隐私约束条件ρ,则部分删除处理当前数据集。在部分删除处理时不断调用隐私检查,直至当前数据集符合数据隐私保护匿名条件时停止,将符合隐私保护匿名要求的当前数据集传送给极小信息控制机制,通过前后信息损失对比决定是否向下进行分组和细化,如果根据分组细化处理后信息损失小,则向下分组细化处理,同时将一个组形成的多个子分组迭代上述过程。但是如果分组细化进行后,信息损失反而增大,则直接发布当前分组。