Jun, 2021

场景图像中的无监督物体级别表示学习

TL;DR本文提出了一种名为 Object-level Representation Learning(ORL)的自监督学习框架,旨在从场景图像中进行物体级别的表示学习,通过利用图像级别的自监督预训练作为先验,实现物体级别的语义对应。实验结果表明,ORL 在场景图像的自监督学习中显著提高了性能,在某些下游任务中甚至超过了受监督的 ImageNet 预训练,并在更多未标记的场景图像可用时改善了下游性能,展示了它在利用野外未标记数据方面的巨大潜力,希望它能激发未来更多关于从场景数据中进行通用无监督表征学习的研究。