NLP中基于样本的序列到序列任务的影响函数解释方法
基本信息
申请号 | CN202210376883.0 | 申请日 | - |
公开(公告)号 | CN114692621A | 公开(公告)日 | 2022-07-01 |
申请公布号 | CN114692621A | 申请公布日 | 2022-07-01 |
分类号 | G06F40/284(2020.01)I | 分类 | 计算;推算;计数; |
发明人 | 秦韵;张帆 | 申请(专利权)人 | 南京工业大学 |
代理机构 | 南京科阔知识产权代理事务所(普通合伙) | 代理人 | - |
地址 | 211899江苏省南京市江北新区浦珠南路30号 | ||
法律状态 | - |
摘要
摘要 | 一种NLP中基于样本的序列到序列任务的影响函数解释方法,包括步骤:1)选取需要获取解释的序列到序列任务,并针对序列到序列任务选取待测的自然语言处理模型和数据集;2)将数据集内的语料进行编码,将编码后的每条数据划分不同区间得到的多条数据并作为新的样本;3)将步骤2)得到的新的样本送入待测模型进行训练,在损失趋于稳定时结束训练;在待测模型训练过程输出的所有检查点中,选取趋近于待测模型最终参数的检查点用于影响分数的计算;4)基于步骤3)选取的检查点中的待测模型参数,计算训练样本与测试样本的损失;5)利用步骤4)得到的样本损失,基于待测模型参数计算梯度向量,按照影响函数公式计算得到影响分数。 |
