%A 任智, 张栋, 唐硕 %T 基于强化学习的改进三维A*算法在线航迹规划 %0 Journal Article %D 2023 %J 系统工程与电子技术 %R 10.12305/j.issn.1001-506X.2023.01.23 %P 193-201 %V 45 %N 1 %U {https://www.sys-ele.com/CN/abstract/article_9030.shtml} %8 2023-01-01 %X

针对飞行器在线航迹规划对算法实时性与结果最优性要求高的问题,基于强化学习方法改进三维A*算法。首先,引入收缩因子改进代价函数的启发信息加权方法提升算法时间性能;其次,建立算法实时性与结果最优性的性能变化度量模型,结合深度确定性策略梯度方法设计动作-状态与奖励函数,对收缩因子进行优化训练;最后,在多场景下对改进后的三维A*算法进行仿真验证。仿真结果表明,改进算法能够在保证航迹结果最优性的同时有效提升算法时间性能。