Jul, 2022

异步课程经验回放:一种深度强化学习方法,用于未知动态环境中的无人机自主运动控制

TL;DR使用深度强化学习方法,将自主运动控制问题建模成马尔科夫决策过程,并通过异步课程经验回放算法以及课程学习的训练范式,在动态三维环境中训练并改进了无人机控制策略,结果表明,该算法在速度和精度上均优于现有算法,且在不同环境下都表现出较强的鲁棒性和泛化能力。