Oct, 2023

LangNav: 语言作为导航的知觉表示

TL;DR以语言作为感知表示来进行视觉和语言导航,探索了离线的视觉系统,将各个时间步骤的视角转换为自然语言描述,并微调预训练的语言模型来选择能够最好地满足导航指令的行动,以语言作为感知表示在导航任务中具有潜力。