强化学习中的策略重用: 研究进展
何立, 沈亮, 李辉, 王壮, 唐文泉
Survey on policy reuse in reinforcement learning
Li HE, Liang SHEN, Hui LI, Zhuang WANG, Wenquan TANG
系统工程与电子技术 . 2022, (3): 884 -899 .  DOI: 10.12305/j.issn.1001-506X.2022.03.21