Jun, 2023

基于视觉信息的描述提升零样本图像分类

TL;DR本文提出了一种名为 V-GLOSS 的方法,利用现代语言模型和语义知识库生成视觉上有根据的类别描述,进而解决现有方法中存在的粒度和标签歧义问题。通过在 ImageNet 和 STL-10 等基准 ZSIC 数据集上实现最新的结果,证明了 V-GLOSS 的有效性,并引入了一个 V-GLOSS 生成的类别描述的银数据集,并展示了它在视觉任务中的有用性。