Feb, 2022

利用导航信息学习视觉表示

TL;DR本研究旨在利用空间和时间的信息来改善自我监督学习,以提高分类性能。我们设计了一种流程来生成来自 ThreeDWorld 的自我视觉图像并记录相关的导航信息。修改动量对比(MoCo)模型,以代替实例区分进行预训练阶段中两个视图的相似性评估。结果显示,对比实例区分方法,本方法优于自我监督训练状态下的性能.