使用视觉注意聚合的深度不平衡属性分类
本文提出了一种利用人工注释属性的属性引导注意力模块 (AGAM),以实现更具有区分性的特征学习,从而改善仅使用视觉信息的查询集的特征选择,达到了不同数据集和设置下的最先进性能。
Sep, 2020
本研究提出一种用于预测对象视觉属性的大规模数据集,通过多标签分类解决对象属性预测问题,并采用多种技术来解决大量属性、标签稀疏性、数据不平衡和对象遮挡等问题,其中包括使用低级和高级 CNN 特征、多跳关注、重新加权和重新抽样技术、负标签扩展和监督属性感知对比学习算法,并取得了超过现有技术水平的 3.7 mAP 和 5.7 F1 值的改进。
Jun, 2021
提出了一种无需像素级注释进行食物图像分类和语义分割模型训练的弱监督方法,该方法基于多实例学习和基于注意力机制的方法,实现了食物类别的分类和语义分割,并在 FoodSeg103 数据集上进行了实验验证和探索了注意力机制的性能特性。
Aug, 2023
本文提出了一种使用深度神经网络应用视觉注意力于细粒度分类任务的新管道,通过整合三种类型的注意力,训练领域特定的深度网络,在弱监督约束下避免使用昂贵的注释,并在 ILSVRC2012 数据集和 CUB200_2011 数据集的子集上验证了该方法的有效性,取得了与其他方法相竞争的表现。
Nov, 2014
该研究提出了一种新的注意力模型,可以通过多层卷积神经网络的渐进式注意力过程精确地关注各种规模和形状的图像目标。实验证明,与传统的注意力方法相比,在视觉属性预测任务中,所提出的注意力网络效果更好。
Jun, 2016
本文提出一种新颖的 Attribute-Aware Attention Model(A^3M)模型,可以同时学习局部属性表示和全局类别表示,通过属性 - 类别互惠过程,从而更好地提取图像中的固有信息,以实现更好的图像识别效果。
Jan, 2019
本文提出一种交互式的方法,通过手动指定区域,让分类器注意到这些区域,以减轻共现偏差对预训练深度神经网络的影响,在 CelebA 数据集上测试并 fine-tuned 预训练 AlexNet 以关注指定的面部属性。
May, 2019
我们提出了一种将人工智能辅助与众包相结合的新颖贴片标记方法,用于减轻图像分类中的偏见,并通过改进分类准确性和模型的注意力焦点来证明其有效性。同时,众包实验证明我们的方法要比使用多边形标注目标位置快 3.4 倍,显著降低了对人力资源的需求。
Mar, 2024
本文介绍了一个关注机制的结构化表示学习框架,可以预测图像类别标签和注意力映射,并在没有其他监督的情况下以端到端的方式进行学习,改进了性能,并在标准场景识别和细粒度分类基准测试中取得了最新成果。
May, 2018