AAAIDec, 2021

利用词向量引导的注意力推断多标签少样本图像分类的原型

TL;DR本文提出了一种使用词嵌入作为多标签图像分类问题的先验知识的解决方案,在少量训练数据的情况下,通过聚合支持图像的本地特征图来获取视觉原型,并通过注意力机制基于标签嵌入来确定相关区域,其在 COCO 和 PASCAL VOC 实验中均优于现有最新成果。