Apr, 2024

多样化和个性化的图像生成用于零 - shot 多标签分类

TL;DR通过生成合成数据,用于训练未见标签的分类器,本文介绍了一种用于零样本多标签分类的创新解决方案,包括使用大型语言模型生成多样的提示,使用 CLIP 模型进行图像筛选,以及使用特征融合模块来提高目标任务的视觉特征。实验结果验证了该方法的有效性,并显示出与现有方法相比的显著改进。