AAAIDec, 2021
利用词向量引导的注意力推断多标签少样本图像分类的原型
Inferring Prototypes for Multi-Label Few-Shot Image Classification with Word Vector Guided Attention
Kun Yan, Chenbin Zhang, Jun Hou, Ping Wang, Zied Bouraoui...
TL;DR本文提出了一种使用词嵌入作为多标签图像分类问题的先验知识的解决方案,在少量训练数据的情况下,通过聚合支持图像的本地特征图来获取视觉原型,并通过注意力机制基于标签嵌入来确定相关区域,其在 COCO 和 PASCAL VOC 实验中均优于现有最新成果。