Jan, 2024

面向开放词汇多标签分类的基于查询的知识共享

TL;DR提出了一种基于查询的知识共享范式,通过预训练的 VLP 模型从输入图像中提取关键的视觉知识,并通过有效的提示池进行鲁棒的标签嵌入,进而在零样本任务中显著提高了标签识别的性能。