Mar, 2023

OVRL-V2: ImageNav 和 ObjectNav 的简单基准线

TL;DR我们提出了一个通用的神经网络架构,该架构由任务无关的组件组成,实现了在 ImageNav 和 ObjectNav 任务上的最新成果,而无需任何任务特定的模块,我们的模型是基于最近的自监督学习(SSL)和视觉变压器(ViT)的预训练模型构建,在 ViT 修补表示上操作一个压缩层以保留空间信息,并改进策略训练,这些改进使我们能够首次在视觉导航任务中展现了正向编放律。