Dec, 2020

使用 Transformer 的拓扑规划实现视觉语言导航

TL;DR本文介绍了一种基于模块化方法的视觉和语言导航技术,使用拓扑地图和注意机制来生成导航计划,并通过低级动作执行控制器实现。实验证明,该方法在自由遍历环境下优于以往的端到端方法。