Dec, 2023

操纵标签空间进行上下文分类

TL;DR在这项研究中,我们提出了两种策略,即标签分布增强和视觉描述增强,以提高多样数据集上的上下文分类性能,包括经典的 ImageNet 和更细粒度的数据集,如 CUB-200。具体而言,我们的方法在 ImageNet 上将准确率从 4 次迭代中的 74.70%提高到仅需要 2 次迭代即可达到 76.21%,超过 CLIP 0.67%。在 CUB-200 上,我们的方法将 1 次迭代的准确率从 48.86%提高到 69.05%,比 CLIP 高出 12.15%。