问答模型的训练方法、计算机设备以及可读存储介质
基本信息
申请号 | CN202010388307.9 | 申请日 | - |
公开(公告)号 | CN111737426A | 公开(公告)日 | 2021-06-01 |
申请公布号 | CN111737426A | 申请公布日 | 2021-06-01 |
分类号 | G06F16/332;G06F16/33;G06N3/04;G06N3/08 | 分类 | 计算;推算;计数; |
发明人 | 黄薇屹;杨敏;曲强;姜青山;贺倩明 | 申请(专利权)人 | 深圳得理科技有限公司 |
代理机构 | 深圳市威世博知识产权代理事务所(普通合伙) | 代理人 | 黎坚怡 |
地址 | 518055 广东省深圳市南山区深圳大学城学苑大道1068号 | ||
法律状态 | - |
摘要
摘要 | 本申请公开了问答模型的训练方法、计算机设备以及计算机可读存储介质。该问答模型的训练方法包括:建立文本匹配模型和元学习模型,文本匹配模型和元学习模型具有相同的深度神经网络结构;获取测试任务和多个不同的训练任务;分别基于多个不同的训练任务各自的第一匹配损失来更新元学习模型的元网络参数,第一匹配损失用于表示多个不同的训练任务各自的文本匹配模型的匹配误差;利用更新后的元网络参数生成文本匹配模型的初始参数,并使用测试任务对文本匹配模型进行训练以更新文本匹配模型的初始参数,将经过训练后所得到的文本匹配模型作为问答模型。通过上述方式,本申请的问答模型能够应用于少样本的问答领域中,并提高问答对匹配的准确性。 |
