Apr, 2023

开放世界弱监督目标定位

TL;DR通过提出一种弱监督对象定位任务 OWSOL (Open-World Weakly-Supervised Object Localization), 并使用一个对比学习方法 (co-learning) 将有标签和无标签数据进行降维表示,通过聚类方法识别有标签数据的类别,最终生成出一个完整的广义类反激活 (Generalized Class Activation Map) 用于对象定位,并提出了多个语义中心点驱动的对比损失 (contrastive loss), 使得算法在 ImageNet-1K 和 iNatLoc500 数据集等 OWL 识别基准上超过所有基线,具有较大的性能优势。