Oct, 2023

自监督 ViTs 时代的无监督对象定位调查

TL;DR最近对开放式视觉系统的热情表明了社区在封闭词汇基准设置之外进行感知任务的高度兴趣。在不事先知道数据集中包含哪些对象的情况下,能够在图像 / 视频中发现对象是一个令人兴奋的前景。最近的研究表明,通过利用自我监督预训练特征,可以进行无类别无监督的对象定位。在自我监督 ViT 的时代,我们在此提出一种调查无监督对象定位方法,其能够在图像中发现对象而无需任何手动注释。我们在以下链接中汇总了所讨论方法的资源库:this https URL