一种基于对抗网络强化学习的问答模型优化方法
基本信息
申请号 | CN201710662815.X | 申请日 | - |
公开(公告)号 | CN107423437B | 公开(公告)日 | 2017-12-01 |
申请公布号 | CN107423437B | 申请公布日 | 2017-12-01 |
分类号 | G06F16/332(2019.01)I;G06N5/02(2006.01)I | 分类 | - |
发明人 | 王春辉 | 申请(专利权)人 | 逸途(北京)科技有限公司 |
代理机构 | 北京国坤专利代理事务所(普通合伙) | 代理人 | 逸途(北京)科技有限公司 |
地址 | 100015北京市朝阳区酒仙桥路4号宏源大厦1904 | ||
法律状态 | - |
摘要
摘要 | 本发明公开了一种基于对抗网络强化学习的问答模型优化方法,问答模型优化方法的原理是在知识库中多问一答以及一问多答题目,然后引入了对抗机制,即通过两套智能问答系统交替问答实现问答交互,基于强化学习机制,最终优化智能问答系统模型并具有奖励系统模型。本发明设计合理,定义了对抗问答交互的优化指标及其计算方式,包括易响应性、内容丰富性、主题演变性及语义连续性,并进一步定义了对抗问答模型优化的奖励函数,强化了学习,可以不断优化问答模型,提高问答交互的质量,提升用户体验。 |
