基于差分隐私技术的问答系统模型训练方法和装置

基本信息

申请号 CN202210159711.8 申请日 -
公开(公告)号 CN114547687A 公开(公告)日 2022-05-27
申请公布号 CN114547687A 申请公布日 2022-05-27
分类号 G06F21/62(2013.01)I;G06F16/332(2019.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I 分类 计算;推算;计数;
发明人 吴存锋;梁尔真;朱志辉;曹军;周蕾 申请(专利权)人 浙江星汉信息技术股份有限公司
代理机构 北京超凡宏宇专利代理事务所(特殊普通合伙) 代理人 -
地址 310000浙江省杭州市下城区沈家路319号519室
法律状态 -

摘要

摘要 本发明提供了一种基于差分隐私技术的问答系统模型训练方法和装置,涉及问答系统的技术领域,包括获取问答系统中目标语言模型对应的隐私机制,其中,隐私机制包括至少一个,隐私机制通过干预目标语言模型保护问答系统的数据集的差分隐私;根据每个隐私机制获取相应的训练样本,并按照每个隐私机制对应的各个预设划分批次的训练样本上添加目标扰动量,得到每个隐私机制对应的目标训练样本;分别将目标训练样本输入目标语言模型,对问答系统的目标语言模型进行训练,缓解了问答系统中的问答对数据易被窃取的技术问题,提高问答系统的安全性。