ACLMar, 2022

基于提示的环境自主探索的视觉语言导航预训练

TL;DR本文提出了一种基于 Prompt 的自我探索方法,通过对环境进行采样来自动生成结构化的指导,从而构建了一个无需人工标注的本地数据集,并引入基于 Prompt 的学习来提高语言嵌入的学习效率,进而大大提高了视觉 - 语言导航模型的泛化能力。