Jul, 2022
异步课程经验回放:一种深度强化学习方法,用于未知动态环境中的无人机自主运动控制
Asynchronous Curriculum Experience Replay: A Deep Reinforcement Learning Approach for UAV Autonomous Motion Control in Unknown Dynamic Environments
Zijian Hu, Xiaoguang Gao, Kaifang Wan, Qianglong Wang, Yiwei Zhai
TL;DR使用深度强化学习方法,将自主运动控制问题建模成马尔科夫决策过程,并通过异步课程经验回放算法以及课程学习的训练范式,在动态三维环境中训练并改进了无人机控制策略,结果表明,该算法在速度和精度上均优于现有算法,且在不同环境下都表现出较强的鲁棒性和泛化能力。