Jun, 2023

无需词汇的图像分类

TL;DR该论文提出了一种名为“无词汇图像分类(VIC)”的新任务,通过使用外部视觉语言数据库(即语义空间)来解决这个任务,为此提出了一个名为 CaSED 的方法,它利用预训练的视觉语言模型和外部视觉语言数据库在训练自由的情况下来完成任务,与其他复杂的视觉语言框架相比,在参数更少的情况下具有更好的分类效果。