NLP中基于样本的序列到序列任务的影响函数解释方法

基本信息

申请号 CN202210376883.0 申请日 -
公开(公告)号 CN114692621A 公开(公告)日 2022-07-01
申请公布号 CN114692621A 申请公布日 2022-07-01
分类号 G06F40/284(2020.01)I 分类 计算;推算;计数;
发明人 秦韵;张帆 申请(专利权)人 南京工业大学
代理机构 南京科阔知识产权代理事务所(普通合伙) 代理人 -
地址 211899江苏省南京市江北新区浦珠南路30号
法律状态 -

摘要

摘要 一种NLP中基于样本的序列到序列任务的影响函数解释方法,包括步骤:1)选取需要获取解释的序列到序列任务,并针对序列到序列任务选取待测的自然语言处理模型和数据集;2)将数据集内的语料进行编码,将编码后的每条数据划分不同区间得到的多条数据并作为新的样本;3)将步骤2)得到的新的样本送入待测模型进行训练,在损失趋于稳定时结束训练;在待测模型训练过程输出的所有检查点中,选取趋近于待测模型最终参数的检查点用于影响分数的计算;4)基于步骤3)选取的检查点中的待测模型参数,计算训练样本与测试样本的损失;5)利用步骤4)得到的样本损失,基于待测模型参数计算梯度向量,按照影响函数公式计算得到影响分数。