本篇文章对细粒度图像分析的最新研究进展进行了系统综述,包括深度学习的应用、细粒度图像识别和检索、公开基准数据集和相关领域的应用,最后提出了需要进一步探索的研究方向和开放问题。
Nov, 2021
精细化图像分类任务中,由于不同子类别间视觉差异小、类内变化大,深度学习方法在解决该问题中取得了显著成功。本文提出一种融合方法,通过将全局纹理与局部基于图像块的信息相结合来解决精细化图像分类问题。我们的方法在人脸、皮肤病变、美食、海洋生物等八个数据集上使用四个标准的骨干 CNN 进行了测试,并在分类准确率上取得了优于现有方法显著的提升。
Aug, 2023
使用大型语言模型作为代理,FineR 在语义细分类别推理方面体现出更好性能,优于几种先进的 FGVR 和语音与视觉助手模型,并展示了在野外和新领域中工作的潜力。
Jan, 2024
通过特征级别的数据增强和协方差预测网络,我们提出了一种改善细粒度图像识别的方法,可以有效区分细分类别,提高泛化性能。
Sep, 2023
细粒度分类、物种识别、计算机视觉、深度卷积网络和视觉转换器是本论文的关键词。通过对 9 种算法进行详细评估,论文提供了对昆虫中的细粒度任务解决程度的全面理解,其中视觉转换器在推理速度和计算成本方面表现最佳,而局部性视觉转换器在性能和嵌入质量方面超过其他算法,而卷积神经网络则在指标上具有折中性。
Apr, 2024
本文介绍了细粒度视觉分类在生物多样性和物种分析领域的挑战性应用,提出了适用于计算机视觉研究的两个具有 675 个高度相似类别的挑战性新数据集,并使用卷积神经网络(CNN)的局部特征呈现了首个结果。最后,我们提出了生物多样性研究中视觉分类领域的新挑战性研究方向清单。
Jul, 2015
本文提出了实用的细粒度图像检索模型设计指南,包括强调对象、凸显子类别特异性差异以及采用有效的训练策略。通过遵循指南并设计了一种新颖的双重视觉过滤机制(DVF),本文在三个广泛使用的细粒度数据集上实现了最先进的性能表现。
本研究提出了一种多阶段度量学习框架,针对细粒度视觉分类中高维特征向量的学习问题,通过距离度量学习解决了相互关联且难以区分的子类别和大量内部类差异等问题,并在 FGVC 基准数据集上取得了显著的性能提升。
Feb, 2014
本研究提出了一种从大规模数据集到小规模、特定领域细粒度图像分类(Fine Grained Visual Categorization, FGVC)任务的迁移学习方法,并通过 Earth Mover's Distance 提出了一种衡量领域相似度的方法,实现了目标领域与数据源领域之间的知识迁移,得到了最先进的结果。
Jun, 2018
该论文提出了一种结合视觉和语言的两流模型,通过深度卷积神经网络从原始图像信息中学习深度表示,并利用自然语言描述来编码区分子类的显著视觉方面,从而实现更好的分类精度。
Apr, 2017