Mar, 2024

上下文 - 语义质量感知网络用于细粒度视觉分类

TL;DR为了解决细粒度视觉分类中的品质问题,本文提出了一种弱监督的上下文 - 语义质量感知网络(CSQA-Net),其中使用多部分和多尺度交叉注意力模块(MPMSCA)来捕捉目标内部更具区别性的细节,提出了一种层次化的多级语义质量评估模块(MLSQE)来逐渐监督和强化骨干网络中的分层语义,最终通过对特征表示的质量进行实时评估,提升了其可辨识性。在四个广泛使用的细粒度视觉分类数据集上进行的综合实验结果表明,提出的 CSQA-Net 优于现有的方法。