ICCVJun, 2021

具有随机环境混合的视觉语言导航

TL;DR本文介绍了一种名为随机环境混合 (Random Environmental Mixup, REM) 的数据增广方法,其通过互换环境中的重要点来生成交叉的房屋场景并产生增广数据,从而帮助代理减少视角偏差的问题,提高了视觉语言导航任务的性能表现,并刷新了标准 VLN 基准数据集的最佳性能记录。