基于游戏树搜索算法的决策模型数据处理方法及系统
基本信息
申请号 | CN202110369855.1 | 申请日 | - |
公开(公告)号 | CN112765242A | 公开(公告)日 | 2021-05-07 |
申请公布号 | CN112765242A | 申请公布日 | 2021-05-07 |
分类号 | G06F16/2458(2019.01)I | 分类 | - |
发明人 | 王嘉旸;雷捷维;李一华;任航;黄伟;熊唤亮;王命延 | 申请(专利权)人 | 中至江西智能技术有限公司 |
代理机构 | 北京清亦华知识产权代理事务所(普通合伙) | 代理人 | 何世磊 |
地址 | 330100江西省南昌市新建区望城新区玉壶山大道414号 | ||
法律状态 | - |
摘要
摘要 | 本发明公开了一种基于游戏树搜索算法的决策模型数据处理方法及系统,该方法包括:在游戏树搜索算法的剪枝策略的设计过程中,利用双深度Q学习算法模型预估在当前出牌决策中出每张牌对应的分数,选择预估得分大于或等于分数阈值的出牌动作来扩展游戏树;在游戏树搜索算法的估值函数的设计过程中,若游戏树搜索算法能够在限定时间内搜索到游戏终局,则将估值函数设置为游戏终局能够获取到的游戏得分,若游戏树搜索算法不能在限定时间内搜索到游戏终局,则利用双深度Q学习算法模型计算当前游戏节点的每个动作的预估分数,并将预估分数的最大值作为估值函数的值。本发明能够在没有大量高质量玩家数据的情况下,构建高水平的智能决策系统。 |
