具有强化学习功能的问答语料学习方法
基本信息
申请号 | CN202110137698.1 | 申请日 | - |
公开(公告)号 | CN112818101A | 公开(公告)日 | 2021-05-18 |
申请公布号 | CN112818101A | 申请公布日 | 2021-05-18 |
分类号 | G06F16/332;G06F16/335;G06N20/00 | 分类 | 计算;推算;计数; |
发明人 | 张鸣;王海涛;詹威;王勤勤;汪鹏;吴凯;石克阳 | 申请(专利权)人 | 杭州微洱网络科技有限公司 |
代理机构 | 杭州裕阳联合专利代理有限公司 | 代理人 | 张解翠 |
地址 | 311121 浙江省杭州市余杭区仓前街道文一西路1382号601-5 | ||
法律状态 | - |
摘要
摘要 | 本发明公开了一种具有强化学习功能的问答语料学习方法,包括以下步骤:通过模型A接收用户输入的若干问题并针对该若干问题分别输出相对应的答案;将用户输入的若干问题中的每个问题和其对应的答案组成问答对;通过模型B对若干问答对进行打分;通过打分后的若干问答对对模型A进行增量学习。本发明提供的具有强化学习功能的问答语料学习方法能够通过强化学习自动训练调整更新模型A,实现模型A的持续性自我微调、自我完善以及自我学习,这样既能够优化针对问题输出的答案,有能够节省大量人工标注,节省劳动力成本。 |
