基于态势表示和行为模仿的管制指令智能生成方法及系统专利查询专利号|摘要-满商公司网

基于态势表示和行为模仿的管制指令智能生成方法及系统

基本信息

摘要

摘要	本发明公开了一种基于态势表示和行为模仿的管制指令智能生成方法及系统，包括：构建飞机表示向量的状态空间；构建对综合态势自感知表示学习的数据集；构建综合态势自感知表示学习网络；构建管制指令生成网络的主干网络；采用两阶段训练策略对管制指令生成网络进行训练；级联综合态势自感知表示学习的主干网络和管制指令生成的主干网络，输入民航自动化系统数据，依据管制指令生成网络输出的指令动作概率，进行采样，输出管制指令。本发明通过对真实扇区综合态势下管制行为的重演数据进行模仿学习，充分利用了人类已有的优秀经验策略指导指令生成网络的训练，弥补了模拟环境中人为定义奖励函数的局限性。