- Hawkeye:基于 PyTorch 的深度学习细粒度图像识别库
目前提供的 FGIR 统一开源软件库不足,本研究提出 Hawkeye,一个基于 PyTorch 的深度学习库,实现了 16 种最新的细粒度方法,为研究者和从业者提供了一个强大的工具来推动他们在 FGIR 领域的研究和开发。
- 可学习的语义数据增强的细粒度识别
通过特征级别的数据增强和协方差预测网络,我们提出了一种改善细粒度图像识别的方法,可以有效区分细分类别,提高泛化性能。
- 用于开放式精细图像识别的互补可变频率感知网络
提出了一种名为 CFAN 的频率可变意识网络,该网络包含三个顺序模块,其中频率可变过滤模块用于从初步特征中分离出高频和低频成分,以及互补的时间聚合模块用于通过两个 LSTM 网络汇聚高频和低频成分,实现了开放式精细图像识别,与大多数现有技术 - ECCV头脑清晰:走向语义一致的视觉反事实
本研究提出了一种新的视觉反事实解释框架,基于语义一致性和多样性因素,可以更有效地用于细粒度图像识别,并通过机器教学实验证明了其实用性和优越性。
- ICCV针对细粒度视觉分类和重新识别的反事实注意力学习
通过因果推断的反事实关注机制,提高注意力质量和网络预测的准确性,在细粒度图像识别任务中实现了持续稳定的改进。
- RAMS-Trans: 基于循环注意力多尺度变换器进行细粒度图像识别
通过使用注意力权重来测量原始图像对应的补丁符记的重要性,我们提出了递归注意力多尺度转换器 (RAMS-Trans),它使用变压器的自我注意力以多尺度的方式递归地学习区分地区的注意力。
- 具有峰值抑制和知识引导的 Transformers 网络用于细粒度图像识别
本文提出了一种基于 Transformer 的架构,包括峰值抑制模块和知识引导模块,以获得更全面的特征表示,弥补了现有方法忽略多图像信息和被忽略区域信息的缺点,并在六个数据集上进行了广泛评估。
- ECCV体积变换网络
本文介绍了一种学习型模块(VTN,即体积变形网络),以预测通道级扭曲场,从而在空间和通道层面上重新配置 CNN 特征,改善空间不变性技术在大规模对象识别中的限制。经实验证明,VTN 不断提升模型性能和图像识别和检索的精度。
- CVPR面向视觉识别的细粒度图像转换
本研究针对图像变换任务中的身份标签保留问题,通过对生成对抗网络的模型改进,提出了一种保留输入图像身份的图像变换方法,并在 CompCars 和 Multi-PIE 数据集上进行了大量实验证明了模型的实际效用,尤其是在细粒度少样本学习任务上。
- ECCV关注激活:用于细粒度图像识别的模块化注意机制
本文提出利用注意力机制在卷积特征激活层面上进行细粒度图像识别,相对于传统方法,在不需要部分标注的情况下使用低层次特征进行输出概率分配,并在 CIFAR-10、Adience gender recognition task、Stanford - 寻找细节中的恶魔:学习三线性注意力采样网络进行细粒度图像识别
本文介绍了 Trilinear Attention Sampling Network (TASN),一种高效的 fine-grained feature 学习方法,通过从数百个部件提议中学习特征并使用多层次的注意力机制来改善细粒度识别性能。 - MM利用分层语义嵌入进行精细化表示学习和识别
通过 Hierarchical Semantic Embedding (HSE) 框架在深层神经网络中整合不同层级的类别预测,从而实现对复杂图像的精细分类,该方法优于基线模型和现有竞争对手,可以应用于精细图像识别领域。
- IJCAI基于知识嵌入的细粒度图像识别表征学习
本文提出了一个知识图谱和门控图神经网络相结合的框架,名为知识嵌入表示学习框架,用于处理细粒度图像识别问题,并在广泛使用的 Caltech-UCSD 鸟数据集上进行了大量实验,证明了该框架超越现有的最先进方法。
- 多关注多分类约束用于细粒度图像识别
本文提出了一种基于注意力机制的卷积神经网络方法,使用一握多激励模块学习每个输入图像的多个注意区域特征,并在度量学习框架中应用多注意力多类约束,通过推拉相同 / 不同注意力类别的特征以实现多个目标区域的协调,并引入 Dogs-in-the-W - 视觉注意力的动态计算时间
提出了一种动态计算时间模型,利用强化学习的方法来加速细粒度图像识别中循环视觉注意 (RAM) 的平均处理时间,该模型通过学习何时停止处理输入图像来决定注意力的数量,实验证明该模型可以有效地减少平均计算时间,同时保持与 RAM 相同的识别性能 - NIPSMask-CNN:用于细粒度图像识别的局部化部件和特征选择
本文提出了一种新颖的端到端 Mask-CNN 模型,旨在解决细粒度图像识别中的挑战,这个模型基于细粒度图像的部件注释,通过卷积网络定位亚区别的部件并生成对象 / 部件掩模,实现对有用和有意义的卷积描述符的选择并聚合在一起,此模型相对于现有最