Nov, 2019

低层次视觉语言导航的多模态注意力网络

TL;DR本文提出了一种基于全注意力机制的低层 VLN 架构,用于实现跨多个模态的长期路径规划,其中包括自然语言、图像和代理人的低级行为控制,实验结果表明其在两个数据集上均获得了良好的性能。