ICCVAug, 2021
Airbert:面向视觉和语言导航的领域内预训练
Airbert: In-domain Pretraining for Vision-and-Language Navigation
Pierre-Louis Guhur, Makarand Tapaswi, Shizhe Chen, Ivan Laptev, Cordelia Schmid
TL;DR本研究介绍了一个大规模、多样化的 BnB VLN 数据集,并使用其进行预训练可以提高在各种 VLN 评估中的性能,特别是在挑战性的 few-shot VLN 评估上。