Nov, 2019
低层次视觉语言导航的多模态注意力网络
Multimodal Attention Networks for Low-Level Vision-and-Language Navigation
Federico Landi, Lorenzo Baraldi, Marcella Cornia, Massimiliano Corsini, Rita Cucchiara
TL;DR本文提出了一种基于全注意力机制的低层 VLN 架构,用于实现跨多个模态的长期路径规划,其中包括自然语言、图像和代理人的低级行为控制,实验结果表明其在两个数据集上均获得了良好的性能。