Mar, 2024

VANP:自我监督视觉行动预训练导航中的视觉焦点学习

TL;DR提出了一种自我监督视觉行为模型(VANP)用于视觉导航的预训练,通过最大化嵌入之间的信息来学习与导航任务相关的特定视觉区域,实现了与完全监督模型相媲美的性能,同时减少了一半的训练时间和仅使用 0.08% 的 ImageNet 数据进行训练。