最大熵细粒度分类
本文提出了一种基于元学习的深度学习模型 MetaFGNet,通过一个新颖的正则化元学习目标来优化网络参数,解决 Fine-grained 视觉分类的训练样本不足问题,并且在辅助数据的筛选上提出了一种简单有效的方案,实验证明了该方法的有效性。
Jul, 2018
本文提出了一种新颖的 Fine-grained visual categorization (FGVC) 方法,可以同时运用环境线索中局部但足够区分的信息和对目标类别下的冗余信息进行压缩,通过计算批次中高权重区域的比例和自适应阈值,实现了输入空间中背景信息的适度提取。此外,本文还使用信息瓶颈方法指导网络在特征空间中学习最小充分表示。实验结果表明,此方法在三个常用基准数据集上表现优于其他最先进的方法和基线模型。
Apr, 2022
本研究提出了一种多阶段度量学习框架,针对细粒度视觉分类中高维特征向量的学习问题,通过距离度量学习解决了相互关联且难以区分的子类别和大量内部类差异等问题,并在 FGVC 基准数据集上取得了显著的性能提升。
Feb, 2014
通过引入 Pairwise Confusion 来优化 Fine-Grained Visual Classification 任务的模型训练,减少过拟合和提高分类和定位效果。
May, 2017
本文提出了一种新颖的细粒度视觉分类框架,其中包括渐进式训练策略和随机拼图补丁生成器,以有效地融合不同粒度的特征,并在多个标准的细粒度视觉分类数据集上取得了最先进的性能表现。
Mar, 2020
本文提出了一个简单而有效的 Salient Mask-Guided Vision Transformer(SM-ViT)方法来在精细 - grained 视觉分类(FGVC)问题中捕捉潜在的可区分特征,进而提高视觉 Transformer 模型的分类性能。实验证明,SM-ViT 比现有的基于 ViT 的方法表现更优秀,需要更少的资源和较低的输入图像分辨率。
May, 2023
通过适用于不变风险最小化和信息瓶颈原理的方法,从泛化的角度解决细粒度视觉分类问题,并应用 Rényi 的 α- 阶熵和软环境分割方案来训练模型,以学习不变和最小化的表示。实验证实了该方案在细粒度视觉分类中能显著提高性能。
Jun, 2023
本文介绍了一种基于 CLIP 模型的多模态提示解决方案(MP-FGVC),通过跨模态描述充分利用 CLIP 模型在细粒度视觉分类(FGVC)任务中的能力,并且通过多模态的协同推理进一步提高 FGVC 的性能。
Sep, 2023
本研究提出了一种从大规模数据集到小规模、特定领域细粒度图像分类(Fine Grained Visual Categorization, FGVC)任务的迁移学习方法,并通过 Earth Mover's Distance 提出了一种衡量领域相似度的方法,实现了目标领域与数据源领域之间的知识迁移,得到了最先进的结果。
Jun, 2018
使用大型语言模型作为代理,FineR 在语义细分类别推理方面体现出更好性能,优于几种先进的 FGVR 和语音与视觉助手模型,并展示了在野外和新领域中工作的潜力。
Jan, 2024