Nov, 2022

结构编码辅助任务在视觉语言导航中改进视觉表示

TL;DR通过结构编码辅助任务 (SEA) 预先训练视觉编码器,可以提高视觉和语言导航中绝对成功率,尤其是在测试环境中,这种预训练技术可以很好地编码场景的结构信息。