IJCAIMay, 2020

诊断视觉语言导航中存在的环境偏差

TL;DR本文旨在通过重新划分环境和特征替换的实验,探讨 Vision-and-Language Navigation 模型中的环境偏差问题。我们发现,ResNet 特征所传递的底层视觉外观直接影响了代理模型,进而导致环境偏差问题。根据这一发现,我们探索了几种包含较少底层视觉信息的语义表示形式,从而使使用这些特征的代理能够更好地推广到未见过的测试环境中。我们的探索性语义特征无需修改基线代理模型及其训练方式,在多个数据集上显著降低了已看和未见之间的性能差距,并取得了与先前的最先进模型具有竞争力的未见结果。