Nov, 2019

利用自监督辅助推理任务的视觉语言导航

TL;DR本文提出了一种基于自我监督的辅助推理导航(AuxRN)框架,使用四个辅助推理任务来利用语义信息,通过这些额外训练信号来帮助代理获取语义表示的知识以便进行推理,进而建立对环境的全面感知,该方法在标准基准测试中实现了最佳效果,显著优于现有的最先进方法。