ICCVJun, 2024

CLIP 解码器:使用多模态 CLIP 对齐表示进行零样本多标签分类

TL;DR多标签分类的零样本学习方法,通过引入 CLIP-Decoder 的多模态表示学习,在零样本多标签分类任务中表现出前沿结果,相较于现有方法在性能上提升了 3.9%,在广义零样本多标签分类任务中提升了近 2.3%。