基于强化学习的改进三维A*算法在线航迹规划
任智, 张栋, 唐硕

Improved three-dimensional A* algorithm of real-time path planning based on reinforcement learning
Zhi REN, Dong ZHANG, Shuo TANG
表4 卷积神经网络参数表
Table 4 Convolutional neural network parameters table
序号 性能 性能参数
1 Actor网络学习率 0.001
2 Critic网络学习率 0.002
3 Batch训练样本大小 128
4 经验回放池大小 10 000
5 软策略更新因子 0.01
6 收缩因子初值 0.4
7 即时回报收敛因子 0.9