Mar, 2020

基于深层模型的强化学习学习飞行

TL;DR通过学习无人机动力学的概率模型,我们使用基于模型的强化学习学习了四旋翼的推进姿态控制器,完全使用生成潜在轨迹通过传播随机解析梯度来优化控制器和价值函数。