Oct, 2023

单正多标语义学习中的视觉语言伪标签

TL;DR提出了一种称为 Vision-Language Pseudo-Labeling 的新方法,通过使用视觉语言模型来建议强正负伪标签,在 Pascal VOC 上提高 5.5%,在 MS-COCO 上提高 18.4%,在 NUS-WIDE 上提高 15.2%,在 CUB-Birds 上提高 8.4%,优于目前的 SOTA 方法。