一种基于对抗网络强化学习的问答模型优化方法

基本信息

申请号 CN201710662815.X 申请日 -
公开(公告)号 CN107423437B 公开(公告)日 2017-12-01
申请公布号 CN107423437B 申请公布日 2017-12-01
分类号 G06F16/332(2019.01)I;G06N5/02(2006.01)I 分类 -
发明人 王春辉 申请(专利权)人 逸途(北京)科技有限公司
代理机构 北京国坤专利代理事务所(普通合伙) 代理人 逸途(北京)科技有限公司
地址 100015北京市朝阳区酒仙桥路4号宏源大厦1904
法律状态 -

摘要

摘要 本发明公开了一种基于对抗网络强化学习的问答模型优化方法,问答模型优化方法的原理是在知识库中多问一答以及一问多答题目,然后引入了对抗机制,即通过两套智能问答系统交替问答实现问答交互,基于强化学习机制,最终优化智能问答系统模型并具有奖励系统模型。本发明设计合理,定义了对抗问答交互的优化指标及其计算方式,包括易响应性、内容丰富性、主题演变性及语义连续性,并进一步定义了对抗问答模型优化的奖励函数,强化了学习,可以不断优化问答模型,提高问答交互的质量,提升用户体验。