一种面向异构环境的基于深度强化学习的轨迹定位方法
基本信息
申请号 | CN202210325226.3 | 申请日 | - |
公开(公告)号 | CN114727229A | 公开(公告)日 | 2022-07-08 |
申请公布号 | CN114727229A | 申请公布日 | 2022-07-08 |
分类号 | H04W4/029(2018.01)I;H04W4/33(2018.01)I;H04W64/00(2009.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I;G06N20/00(2019.01)I | 分类 | 电通信技术; |
发明人 | 郭贤生;李彤;张玉坤;李林;黄健;段林甫;钱博诚 | 申请(专利权)人 | 电子科技大学长三角研究院(衢州) |
代理机构 | 成都点睛专利代理事务所(普通合伙) | 代理人 | - |
地址 | 324000浙江省衢州市柯城区芹江东路288号创新大厦1号楼18楼 | ||
法律状态 | - |
摘要
摘要 | 本发明属于室内定位技术领域,具体是涉及一种面向异构环境的基于深度强化学习的轨迹定位方法。本发明充分利用了环境中的观测和智能体自身的历史动态信息,以智能体的位置、环境中具有设备异构性的RSS向量和过去n个时刻的历史动作为状态,用于动作的选择。再基于近场条件选择强于RSS阈值对应的APs,以构成选定的APs集合,再根据集合的大小计算最终奖赏值。依据MDP中设计的各要素对智能体的位置进行估计,并以奖赏值为学习导向基于经验重放机制和目标网络进行深度强化学习算法的迭代训练。本发明基于路径损耗模型得到具有设备异构性的仿真RSS数据,实验结果证明本发明所提方法能够实现较高的定位精度,并对处理异构RSS数据也具有一定的鲁棒性。 |
