- 无数据知识蒸馏用于细粒度视觉分类
我们提出了一种名为 DFKD-FGVC 的方法,它扩展了 DFKD 到细粒度视觉分类任务,使用了对抗蒸馏框架、注意力生成器、混合高阶注意力蒸馏和语义特征对比学习,以实现更好的性能表现。
- 上下文 - 语义质量感知网络用于细粒度视觉分类
为了解决细粒度视觉分类中的品质问题,本文提出了一种弱监督的上下文 - 语义质量感知网络(CSQA-Net),其中使用多部分和多尺度交叉注意力模块(MPMSCA)来捕捉目标内部更具区别性的细节,提出了一种层次化的多级语义质量评估模块(MLSQ - Finer: 大规模视觉语言模型中细粒度视觉概念识别的研究与增强
最近在指导的大型视觉语言模型方面取得的进展,使得模型能够轻松生成高层次的基于图像的解释。然而,我们的工作揭示了这些模型在细粒度的视觉分类方面的缺陷,并且我们提出了一个多粒度属性为中心的评估基准,用于评估大型视觉语言模型的细粒度视觉理解能力并 - ViTree: 專業化合成神經樹用於逐步解釋微細化視覺分類
综合应用于各个领域的计算机视觉不断发展,对深度学习模型的可解释性提出了迫切要求。本研究提出了一种新颖的方法 ViTree,用于细粒度视觉分类,该方法将流行的视觉转换器作为特征提取骨干,与神经决策树相结合。通过遍历树路径,ViTree 有效地 - 详细强化扩散模型:少样本条件下的增强细粒度视觉分类
为了解决有限样本数据情况下对细粒度视觉识别任务的困难,我们提出了一种新的方法,称为细节增强扩散模型(DRDM),通过两个关键组成部分 —— 有辨别力的语义重组(DSR)和空间知识引用(SKR),有效地利用大型模型的知识来解决数据稀缺性问题, - 应对变化:学习细粒度视觉分类不变和最小充分表示
通过适用于不变风险最小化和信息瓶颈原理的方法,从泛化的角度解决细粒度视觉分类问题,并应用 Rényi 的 α- 阶熵和软环境分割方案来训练模型,以学习不变和最小化的表示。实验证实了该方案在细粒度视觉分类中能显著提高性能。
- CDLT: 面向细粒度视觉分类的带概念漂移和长尾分布的数据集
为实现精细视觉分类技术的实际推广,创造了一个概念漂移和长尾分布数据集,其中 11195 张图片在 47 个连续月中收集,使用了最先进的分类模型进行了广泛的基线实验。
- MMSIM-Trans:用于精细视觉分类的结构信息建模 Transformer
本文提出了一种结构信息建模 transformer 方法(SIM-Trans),以增强 Fine-grained visual categorization 任务中物体的判别表征学习,其中引入了两个轻量级并易于端到端训练的模块:结构信息学习 - R2-Trans: 细粒度视觉分类中的冗余减少
本文提出了一种新颖的 Fine-grained visual categorization (FGVC) 方法,可以同时运用环境线索中局部但足够区分的信息和对目标类别下的冗余信息进行压缩,通过计算批次中高权重区域的比例和自适应阈值,实现了输 - 特征融合视觉 Transformer 用于细粒度视觉分类
本文提出了一个基于 Transformer 的框架,通过聚合特征来处理细粒度视觉分类任务,其中引入了一种新的令牌选择模块(MAWS)来引导网络有效地选择具有判别性的令牌,从而实现了最先进的性能。
- CVPR自然世界图像集的表示学习基准测试
本研究提供两个新的自然世界分类数据集 iNat2021 和 NeWT,探索了 fine-grained 类别的大规模表示和迁移学习的问题。研究表明,在各种任务中,基于 ImageNet 和 iNat2021 有监督方法学习到的特征优于 Si - TOAN:针对少标注样本的细粒度图像分类的目标导向对齐网络
本研究提出了一种面向目标的对齐网络(TOAN),通过在嵌入特征空间中将每个支持图像的特征转换以匹配查询图像,并通过将组合概念表示集成到全局二阶池化中来生成具有区分性的细粒度特征,以处理 Fine-Grained 分类问题下的小样本学习。实验 - CVPR细粒度视觉分类的注意力卷积二元神经树
本文提出了一种基于关注的卷积二叉神经树框架,并使用路由功能、注意力变换器模块以及负对数似然损失函数等处理技术来解决细粒度视觉分类中遇到的问题,在多个标准数据集上的实验结果表明该方法性能优于先前提出的方法。
- CVPRFoodX-251: 精细化食物分类数据集
该研究提出了 FoodX-251 数据集,包含 251 个细分食品类别和 158,000 张图片,可用于评估计算机视觉模型以识别不同食品之间的视觉相似性。我们为 40,000 张图像提供了经过人工验证的标签,用作验证和测试。这个数据集已经被 - ECCV使用元学习优化和辅助数据样本选择的细粒度视觉分类
本文提出了一种基于元学习的深度学习模型 MetaFGNet,通过一个新颖的正则化元学习目标来优化网络参数,解决 Fine-grained 视觉分类的训练样本不足问题,并且在辅助数据的筛选上提出了一种简单有效的方案,实验证明了该方法的有效性。
- CVPR大规模细粒度分类和领域特定的迁移学习
本研究提出了一种从大规模数据集到小规模、特定领域细粒度图像分类(Fine Grained Visual Categorization, FGVC)任务的迁移学习方法,并通过 Earth Mover's Distance 提出了一种衡量领域相 - MM一次性细粒度实例检索
本文提出了一个称为 One-Shot Fine-Grained Instance Retrieval (OSFGIR) 的检索任务,并介绍了一个辅助数据集(OSFGIR-378K dataset)。最后,提出了一个由三个组成部分(粗糙检索, - 用 Part-Stacked CNN 进行细粒度视觉分类
本文提出了一种基于部位的 CNN 模型,在手动标注的强部位注释的基础上,通过模拟物体部件之间微小的差异来显式解释精细分类过程,同时由计算多个物体部分之间的共享策略,提高了效率,并获得了良好的准确度和模型可解释性的实验结果。
- 使用姿态规范化深度卷积神经网络进行鸟类物种分类
本研究提出一种基于深度卷积网络的姿态标准化方法和特征学习策略,相比于以往算法,在鸟种识别领域取得了更好的分类效果。
- CVPR多阶段度量学习实现细粒度视觉分类
本研究提出了一种多阶段度量学习框架,针对细粒度视觉分类中高维特征向量的学习问题,通过距离度量学习解决了相互关联且难以区分的子类别和大量内部类差异等问题,并在 FGVC 基准数据集上取得了显著的性能提升。