Sep, 2022

LOViS: 为视觉语言导航学习方向和视觉信号

TL;DR本文设计了一种具有显式方向和视觉模块的神经代理,通过特定的预训练任务,强化代理的空间推理和视觉感知,在 Room2room 和 Room4room 数据集上均取得了最先进的结果。