Aug, 2022

一种双模态方法用于(零样本)多标签分类

TL;DR该论文提出了一个新算法 - Aligned Dual moDality ClaSsifier (ADDS),其中包括一个双模式解码器 (DM-decoder) 和视觉和文本特征之间的对齐,用于多标签分类任务,并设计了一种称为金字塔前馈 (Pyramid-Forwarding) 的方法来增强输入的性能,通过在多个基准数据集,如 MS-COCO 和 NUS-WIDE 上进行了广泛的实验,证明了该方法显著优于以前的方法,并为传统的多标签分类,零样本多标签分类,以及单到多标签分类提供了最先进的性能。