最大熵细粒度分类

NIPSSep, 2018

Maximum-Entropy Fine-Grained Classification

Abhimanyu Dubey, Otkrist Gupta, Ramesh Raskar, Nikhil Naik

TL;DR本论文提出一种基于最大熵学习的卷积神经网络训练方法，以提高细粒度视觉分类任务的表现，并在此基础上取得了最新成果。该方法具有鲁棒性，可适用于各种类似问题的解决。

Abstract

fine-grained visual classification (FGVC) is an important computer vision problem that involves small diversity within the different classes, and often requires expert annotators to collect data. Utilizing this notion of small visual diversity, we revisit →

fine-grained visual classification maximum-entropy learning convolutional neural networks state-of-the-art performance robustness

发现论文，激发创造

使用元学习优化和辅助数据样本选择的细粒度视觉分类

本文提出了一种基于元学习的深度学习模型 MetaFGNet，通过一个新颖的正则化元学习目标来优化网络参数，解决 Fine-grained 视觉分类的训练样本不足问题，并且在辅助数据的筛选上提出了一种简单有效的方案，实验证明了该方法的有效性。

Jul, 2018

R2-Trans: 细粒度视觉分类中的冗余减少

本文提出了一种新颖的 Fine-grained visual categorization (FGVC) 方法，可以同时运用环境线索中局部但足够区分的信息和对目标类别下的冗余信息进行压缩，通过计算批次中高权重区域的比例和自适应阈值，实现了输入空间中背景信息的适度提取。此外，本文还使用信息瓶颈方法指导网络在特征空间中学习最小充分表示。实验结果表明，此方法在三个常用基准数据集上表现优于其他最先进的方法和基线模型。

Apr, 2022

多阶段度量学习实现细粒度视觉分类

本研究提出了一种多阶段度量学习框架，针对细粒度视觉分类中高维特征向量的学习问题，通过距离度量学习解决了相互关联且难以区分的子类别和大量内部类差异等问题，并在 FGVC 基准数据集上取得了显著的性能提升。

Feb, 2014

细粒度视觉分类的成对混淆

通过引入 Pairwise Confusion 来优化 Fine-Grained Visual Classification 任务的模型训练，减少过拟合和提高分类和定位效果。

May, 2017

通过逐步多粒度拼图块训练进行细粒度视觉分类

本文提出了一种新颖的细粒度视觉分类框架，其中包括渐进式训练策略和随机拼图补丁生成器，以有效地融合不同粒度的特征，并在多个标准的细粒度视觉分类数据集上取得了最先进的性能表现。

Mar, 2020

基于显著掩膜引导的视觉 Transformer 用于细粒度分类

本文提出了一个简单而有效的 Salient Mask-Guided Vision Transformer（SM-ViT）方法来在精细 - grained 视觉分类（FGVC）问题中捕捉潜在的可区分特征，进而提高视觉 Transformer 模型的分类性能。实验证明，SM-ViT 比现有的基于 ViT 的方法表现更优秀，需要更少的资源和较低的输入图像分辨率。

May, 2023

应对变化：学习细粒度视觉分类不变和最小充分表示

通过适用于不变风险最小化和信息瓶颈原理的方法，从泛化的角度解决细粒度视觉分类问题，并应用 Rényi 的 α- 阶熵和软环境分割方案来训练模型，以学习不变和最小化的表示。实验证实了该方案在细粒度视觉分类中能显著提高性能。

Jun, 2023

深入探讨多模式提示在细粒度视觉分类中的应用

本文介绍了一种基于 CLIP 模型的多模态提示解决方案（MP-FGVC），通过跨模态描述充分利用 CLIP 模型在细粒度视觉分类（FGVC）任务中的能力，并且通过多模态的协同推理进一步提高 FGVC 的性能。

Sep, 2023

大规模细粒度分类和领域特定的迁移学习

本研究提出了一种从大规模数据集到小规模、特定领域细粒度图像分类（Fine Grained Visual Categorization, FGVC）任务的迁移学习方法，并通过 Earth Mover's Distance 提出了一种衡量领域相似度的方法，实现了目标领域与数据源领域之间的知识迁移，得到了最先进的结果。

Jun, 2018

用大型语言模型实现细粒度视觉识别的民主化

使用大型语言模型作为代理，FineR 在语义细分类别推理方面体现出更好性能，优于几种先进的 FGVR 和语音与视觉助手模型，并展示了在野外和新领域中工作的潜力。

Jan, 2024