Jul, 2017

强化学习控制四轴飞行器

TL;DR本文介绍一种基于强化学习技术训练的神经网络控制四旋翼的方法,提出了一种新的、相对于现有算法更适用于控制四旋翼的学习算法,实验结果表明,该策略网络可以相对准确地对步阶响应做出反应,并且在非常恶劣的初始化情况下(手动向上扔,并具有 5m/s 的初始速度)也能够将四旋翼稳定悬停在空中,同时每个时间步的策略评估计算时间仅为 7μs。