摘要:
针对静态分配模型的不足,基于部分可观的马尔可夫决策过程建立对单个目标的多阶段决策模型,以反映任务执行效果及反馈信息中的不确定性,进而提出对多个目标的动态资源分配模型。在离线优化阶段中,通过对偶分解法将其分解为一系列较易求解的子问题,并基于次梯度算法调整资源价格,以协调子问题所构造策略中资源的使用量。在实时决策中,根据所得策略及实际执行情况指定对目标的具体行动方案,确保约束条件得以满足。仿真结果表明了方法的有效性。
李远,苏菲,朱华勇,沈林成. 部分可观条件下空对地打击中的动态资源分配[J]. Journal of Systems Engineering and Electronics, 2010, 32(9): 1931-1936.
LI Yuan,SU Fei,ZHU Hua-yong,SHEN Lin-cheng. Dynamic resources allocation for air-to-ground operations with partially observable outcomes[J]. Journal of Systems Engineering and Electronics, 2010, 32(9): 1931-1936.