Sep, 2022

利用深度强化学习进行无地图水空混合飞行器导航与环境通用化

TL;DR本文介绍了一种基于最新的 actor-critic 算法的新方法,以解决 HUAUV 的导航和介质转换问题。我们展示了一种双重评论家 Deep-RL 的方法,通过仅使用范围数据和相对定位来提高 HUAUV 的导航性能。我们的 Deep-RL 方法在不同模拟场景中实现了学习的坚实泛化,表现出更好的导航和转换能力,优于以前的方法。