Sep, 2022

视觉四旋翼导航的并行强化学习模拟

TL;DR该研究提出了一种基于 AirSim 的仿真框架,实现了有效的并行训练、分散式训练和大规模代理训练,从而在机器人的视觉四轴导航中实现了学习时间从 3.9 小时降低到 11 分钟的优化。