一种基于联邦学习的数据分析方法及系统
基本信息
申请号 | CN202111562448.9 | 申请日 | - |
公开(公告)号 | CN114372287A | 公开(公告)日 | 2022-04-19 |
申请公布号 | CN114372287A | 申请公布日 | 2022-04-19 |
分类号 | G06F21/62(2013.01)I;G06N20/00(2019.01)I | 分类 | 计算;推算;计数; |
发明人 | 杨远;刘昊;李云鹏;杨凡;麦泽庆;郭常占;史俊才;燕青 | 申请(专利权)人 | 健康数据(北京)科技有限公司 |
代理机构 | 广东高端专利代理事务所(特殊普通合伙) | 代理人 | 李彩凤 |
地址 | 100000北京市朝阳区望京园401号楼14层1701 | ||
法律状态 | - |
摘要
摘要 | 本发明公开了一种基于联邦学习的数据分析方法及系统,方法包括:确定数据需求集合与训练模型;将数据需求集合传输至每一数据节点提取训练样本;基于训练样本训练得到每一数据节点的梯度数据,聚合分析得到训练结果,并提取数据特征;将数据特征传输至每一数据节点进行特征匹配,匹配得到每一数据节点中适配于数据特征的近似样本;若存在任一数据节点的训练样本与近似样本一致,对训练结果进行脱敏处理。本发明实施例中,通过对训练结果提取数据特征,并根据数据特征于训练样本进行匹配,若匹配成功,则证明训练结果存在隐私泄露风险,据此对训练结果进行脱敏,避免诸如推导公开数据溯源原始数据的情况发生,确保数据安全。 |
