Jul, 2023

基于好奇心驱动的强化学习的低层次飞行控制

TL;DR提出了一种基于好奇心驱动的算法,通过生成适当的马达速度来控制自主学习,使四旋翼可以通过障碍物并将航向朝向目标位置,实现了最优策略的学习和最大化奖励的能力。