Nov, 2022
结构编码辅助任务在视觉语言导航中改进视觉表示
Structure-Encoding Auxiliary Tasks for Improved Visual Representation in Vision-and-Language Navigation
Chia-Wen Kuo, Chih-Yao Ma, Judy Hoffman, Zsolt Kira
TL;DR通过结构编码辅助任务 (SEA) 预先训练视觉编码器,可以提高视觉和语言导航中绝对成功率,尤其是在测试环境中,这种预训练技术可以很好地编码场景的结构信息。