- 通过结构和主题保留增强技术推进细粒度分类
在细粒度视觉分类任务中,对于难以区分的子类别,使用新的数据增强方法 SaSPA 来增加数据集的多样性和总结准确类别的表达,通过对图像边缘和主体表征的条件机制进行模型训练,并在多个设置下比较了传统的和最新的生成数据增强方法,发现对于细粒度视觉 - CVPR具有鲁棒性和可解释性的细粒度视觉分类与迁移学习:双车道框架
通过使用双行道框架 (DCF) 这一自动的最佳训练解决方案搜索框架,本研究填补了缺乏方法来系统地决定最佳训练策略的不足,并证实了 DCF 在精细化视觉分类任务中引导鲁棒且解释性人工智能解决方案发展的潜力。
- AAAI软标签选择的扩张与收缩:半监督细粒度学习
基于类别迁移跟踪的带有置信度感知聚类的软标签选择方法提高了半监督学习中细粒度视觉分类的性能。
- 深入探讨多模式提示在细粒度视觉分类中的应用
本文介绍了一种基于 CLIP 模型的多模态提示解决方案(MP-FGVC),通过跨模态描述充分利用 CLIP 模型在细粒度视觉分类(FGVC)任务中的能力,并且通过多模态的协同推理进一步提高 FGVC 的性能。
- 重新调整焦点是迁移学习的关键
介绍了一种名为 TOAST 的创新的迁移学习算法,该算法利用任务相关元素来重新调整模型的关注点,从而实现在细粒度视觉分类数据集上超越当前最先进方法的表现。
- 基于显著掩膜引导的视觉 Transformer 用于细粒度分类
本文提出了一个简单而有效的 Salient Mask-Guided Vision Transformer(SM-ViT)方法来在精细 - grained 视觉分类(FGVC)问题中捕捉潜在的可区分特征,进而提高视觉 Transformer - PVP:预训练的视觉参数高效微调
本研究提出了一种基于先前训练模型的视觉快速参数调整 (PVP) 框架,可有效降低由于高计算和存储成本带来的计算和存储成本,并在低数据环境下实现优异的结果,特别是在贫瘠的视觉分类领域中。
- SR-GNN: 面向细粒度图像分类的空间关系感知图神经网络
本文介绍一种有效的方法,通过聚合来自最相关的图像区域的上下文感知特征及其在区分细粒度类别中的重要性来捕获细微变化,避免边框和 / 或可见部分注释,并通过自我关注和图形神经网络的最新进展来包括一种简单而有效的关系感知特征变换及其在端到端学习过 - 肾病理学中自动细粒度糸球体损伤识别
本文提出了一种从全幅切片图像中识别细粒度肾小球病变的方案,通过一个聚焦实例结构相似性 loss 来驱动模型精确定位所有类型的肾小球,设计了一种不需要边界框注释的不确定性辅助配应网络来进行细粒度视觉分类,结果表明,相比较其他显著检测方法,在幻 - MetaFormer: 一种用于细粒度识别的统一元框架
本文介绍了 MetaFormer 方法,它使用统一和简单的框架利用各种元信息来协助细粒度图像识别。实验证明,MetaFormer 可以有效地使用各种元信息来提高细粒度识别的性能,并且在 iNaturalist2017 和 iNaturali - 一个用于细粒度视觉分类的新插件模块
本文提出了一种新的插件模块,可集成到 CNN 或 Transformer 等常见的后背网络中,输出像素级特征图并融合过滤后的特征以增强细粒度视觉分类,实验结果表明所提出的插件模块优于现有方法,可显着提高准确性。
- 标签关系图增强的分层残差网络用于分层多粒度分类
该论文研究了层次多粒度分类问题,基于所提出的组合损失以及继承父级别特征的方法,设计了一种基于层次残差网络的深度神经网络结构,展示了该方法有效性在通常数据集上优于目前最先进的方法及精细分类方法利用标签层次结构。
- CVPR对比度视觉表征学习何时有效?
本文研究了自监督学习在四个不同的大规模数据集上的对比学习方法,通过数据量、数据领域、数据质量和任务粒度,得出了有关成功自监督学习所需条件的新见解,其中包括:(i) 除 500k 张图像外,额外的预训练数据的收益有限;(ii) 添加来自另一个 - TransFG: 用于细粒度识别的 Transformer 架构
本文介绍了一个基于 Vision Transformer 和 Part Selection Module 的模型 ——TransFG,可以有效提取重要的图像特征,应用于 Fine-grained visual classification, - CVPR你的 “火烈鸟” 与我的 “鸟”:细粒度还是不细粒度
通过构建分类标签层次结构、引入多粒度标签、优化特征学习和分类方法,本文在细粒度图像分类中达到优秀表现,并且比现有的单标签细粒度图像分类表现更佳。
- 通过逐步多粒度拼图块训练进行细粒度视觉分类
本文提出了一种新颖的细粒度视觉分类框架,其中包括渐进式训练策略和随机拼图补丁生成器,以有效地融合不同粒度的特征,并在多个标准的细粒度视觉分类数据集上取得了最先进的性能表现。
- 弱监督注意力金字塔卷积神经网络用于细粒度视觉分类
该论文提出了 Attention Pyramid Convolutional Neural Network (AP-CNN) 模型,通过集成低级信息以及 ROI 引导精细调整等策略来提高对物体细分类别的识别准确率。在三个 Fine-grai - NIPS最大熵细粒度分类
本论文提出一种基于最大熵学习的卷积神经网络训练方法,以提高细粒度视觉分类任务的表现,并在此基础上取得了最新成果。该方法具有鲁棒性,可适用于各种类似问题的解决。
- ECCV细粒度视觉分类的成对混淆
通过引入 Pairwise Confusion 来优化 Fine-Grained Visual Classification 任务的模型训练,减少过拟合和提高分类和定位效果。
- CVPR生物多样性分析的细粒度识别数据集
本文介绍了细粒度视觉分类在生物多样性和物种分析领域的挑战性应用,提出了适用于计算机视觉研究的两个具有 675 个高度相似类别的挑战性新数据集,并使用卷积神经网络(CNN)的局部特征呈现了首个结果。最后,我们提出了生物多样性研究中视觉分类领域