识别对抗样本以保护模型安全的方法及装置
基本信息
申请号 | CN202010040234.4 | 申请日 | - |
公开(公告)号 | CN110852450A | 公开(公告)日 | 2020-02-28 |
申请公布号 | CN110852450A | 申请公布日 | 2020-02-28 |
分类号 | G06N20/00;G06F21/62 | 分类 | 计算;推算;计数; |
发明人 | 石磊磊;熊涛 | 申请(专利权)人 | 蚂蚁智安安全技术(上海)有限公司 |
代理机构 | 北京亿腾知识产权代理事务所(普通合伙) | 代理人 | 支付宝(杭州)信息技术有限公司;上海风报信息科技有限公司 |
地址 | 310000 浙江省杭州市西湖区西溪路556号8层B段801-11 | ||
法律状态 | - |
摘要
摘要 | 本说明书实施例提供一种识别对抗样本以保护隐私安全的方法,该方法包括:首先,对涉及隐私数据的多个非对抗样本进行采样,得到第一对照样本集;接着,向第一对照样本集中加入待检测的目标样本,得到第一实验样本集;然后,分别利用第一对照样本集和第一实验样本集对初始机器学习模型进行训练,得到训练后的第一对照模型和第一实验模型;再接着,利用测试样本集分别对第一对照模型和第一实验模型进行性能评估,得到针对预设评估指标的第一对照值和第一实验值;再然后,计算第一对照值和第一实验值的差值,作为目标样本针对模型性能的第一增益值。由此,可以基于第一增益值或重复上述流程而得到的多个增益值,判别目标样本是否为对抗样本。 |
