一种基于深度强化学习的空间搜索方法及设备

基本信息

申请号 CN202011616392.6 申请日 -
公开(公告)号 CN112633591A 公开(公告)日 2021-04-09
申请公布号 CN112633591A 申请公布日 2021-04-09
分类号 G06Q10/04;G06N3/08 分类 计算;推算;计数;
发明人 潘泽文;许轶博;范宏伟;李佳斌 申请(专利权)人 成都艾特能电气科技有限责任公司
代理机构 成都九鼎天元知识产权代理有限公司 代理人 胡川
地址 610000 四川省成都市高新区天辰路88号1栋6层1号
法律状态 -

摘要

摘要 本发明提供了一种基于深度强化学习的空间搜索方法及设备,方法包括获取空间数据信息,建立实际空间搜索模型;制定空间搜索路径规划结果的评价函数;根据所述空间搜索模型对路径规划进行网络模型的构建;采用强化学习方法迭代训练神经网络获取损失函数;通过反向传播训练神经网络并作为空间搜索路径规划决策模型输出。本发明通过根据实际需求构建空间搜索模型,进而建立评价函数作为机器学习目标,通过强化学习迭代训练使网络模型收敛至实际收益,适用于决策大规模的空间搜索路径规划问题。