CVPRMay, 2022

ADAPT: 视觉语言导航中的模态对齐行动提示

TL;DR本文提出了一种 Modality-Alignment Action Prompts (ADAPT) 方法,通过显式学习行动水平的模态对齐来实现对视觉环境下指令级操作的感知导航,并通过对高质量行动提示进行收集来提升对相关提示的对齐性。