非完全信息环境下的博弈决策方法、系统和智能体
基本信息
申请号 | CN201811539024.9 | 申请日 | - |
公开(公告)号 | CN109670596A | 公开(公告)日 | 2019-04-23 |
申请公布号 | CN109670596A | 申请公布日 | 2019-04-23 |
分类号 | G06N5/04(2006.01)I; G06N3/04(2006.01)I | 分类 | 计算;推算;计数; |
发明人 | 宋俊潇 | 申请(专利权)人 | 启元世界(北京)信息技术服务有限公司 |
代理机构 | 北京五洲洋和知识产权代理事务所(普通合伙) | 代理人 | 启元世界(北京)信息技术服务有限公司 |
地址 | 100192 北京市海淀区后屯路28号院1号楼4层428室 | ||
法律状态 | - |
摘要
摘要 | 本发明公开了一种非完全信息环境下的博弈决策方法和系统,方法包括:根据环境的当前已知状态对所述环境的当前未知状态进行推理得到未知推理状态;根据所述未知推理状态进行探索,得到与所述当前未知状态对应的未知实际状态,根据所述未知实际状态和历史已知状态得到决策用状态;根据所述未知推理状态、决策用状态、当前已知状态和上一时刻所述环境的反馈做出决策。系统包括:未知推理模块、状态探索模块和决策模块。本发明通过上述技术方案利用已知状态进行预测推理,对推理出的状态进行探索和整合,综合探索出的状态和推理出的状态进行决策,使得决策能力强,长期规划好。 |
