本文提出了一种新颖的 Fine-grained visual categorization (FGVC) 方法,可以同时运用环境线索中局部但足够区分的信息和对目标类别下的冗余信息进行压缩,通过计算批次中高权重区域的比例和自适应阈值,实现了输入空间中背景信息的适度提取。此外,本文还使用信息瓶颈方法指导网络在特征空间中学习最小充分表示。实验结果表明,此方法在三个常用基准数据集上表现优于其他最先进的方法和基线模型。
Apr, 2022
本论文提出一种基于最大熵学习的卷积神经网络训练方法,以提高细粒度视觉分类任务的表现,并在此基础上取得了最新成果。该方法具有鲁棒性,可适用于各种类似问题的解决。
Sep, 2018
本研究提出了一种多阶段度量学习框架,针对细粒度视觉分类中高维特征向量的学习问题,通过距离度量学习解决了相互关联且难以区分的子类别和大量内部类差异等问题,并在 FGVC 基准数据集上取得了显著的性能提升。
Feb, 2014
本文介绍了一种基于 CLIP 模型的多模态提示解决方案(MP-FGVC),通过跨模态描述充分利用 CLIP 模型在细粒度视觉分类(FGVC)任务中的能力,并且通过多模态的协同推理进一步提高 FGVC 的性能。
Sep, 2023
本文提出了一种新颖的细粒度视觉分类框架,其中包括渐进式训练策略和随机拼图补丁生成器,以有效地融合不同粒度的特征,并在多个标准的细粒度视觉分类数据集上取得了最先进的性能表现。
Mar, 2020
通过使用部分标记数据来识别未标记图像的新类别,本研究引入了一项名为 Ultra-Fine-Grained Novel Class Discovery(UFG-NCD)的新任务,并提出了一种名为 Region-Aligned Proxy Learning(RAPL)的框架,用于解决 Ultra-FGVC 中的挑战。实验表明,RAPL 在各种数据集上显著优于基准方法,显示其在处理 UFG-NCD 挑战方面的有效性。
May, 2024
本文提出了一种基于元学习的深度学习模型 MetaFGNet,通过一个新颖的正则化元学习目标来优化网络参数,解决 Fine-grained 视觉分类的训练样本不足问题,并且在辅助数据的筛选上提出了一种简单有效的方案,实验证明了该方法的有效性。
Jul, 2018
本研究以图像识别为课题,使用 Group Sensitive TRiplet Sampling 方法并融合 intra-class variance 到深层度量学习模型的 triplet 损失函数中,以提高 fine-grained visual recognition 的性能。在 CompCar 和 VehicleID 两个基准数据集上实验证明 GS-TRS 显著优于现有的所有方法。
Mar, 2017
本研究提出了一种从大规模数据集到小规模、特定领域细粒度图像分类(Fine Grained Visual Categorization, FGVC)任务的迁移学习方法,并通过 Earth Mover's Distance 提出了一种衡量领域相似度的方法,实现了目标领域与数据源领域之间的知识迁移,得到了最先进的结果。
Jun, 2018
精细化图像分类任务中,由于不同子类别间视觉差异小、类内变化大,深度学习方法在解决该问题中取得了显著成功。本文提出一种融合方法,通过将全局纹理与局部基于图像块的信息相结合来解决精细化图像分类问题。我们的方法在人脸、皮肤病变、美食、海洋生物等八个数据集上使用四个标准的骨干 CNN 进行了测试,并在分类准确率上取得了优于现有方法显著的提升。
Aug, 2023