通过最近邻分类器目标和自监督学习的实例损失,结合粗标签和潜在细粒度空间,学习细粒度表示来提高图像检索的精度,从而在 iNaturalist-2018 等五个公共基准上建立了新的最先进技术。
Nov, 2020
该论文提出了一种称为 Bilinear 卷积神经网络(B-CNNs)的神经网络模型,通过使用两个卷积神经网络所提取的特征的外积计算来表示图像,并以平移不变的方式捕捉局部特征交互,并在多项图像分类数据集上展示了其在识别精度和速度等方面的优越性。
Apr, 2015
本文提出了一种多任务学习框架,同时优化分类和相似性约束,将标签结构(如层次结构或共享属性)嵌入到框架中以建模多级相关性,从而实现精细的特征表示,并在细粒度数据集上得到了非常竞争的性能。
Dec, 2015
该研究提出了 FoodX-251 数据集,包含 251 个细分食品类别和 158,000 张图片,可用于评估计算机视觉模型以识别不同食品之间的视觉相似性。我们为 40,000 张图像提供了经过人工验证的标签,用作验证和测试。这个数据集已经被用于组织 Fine-Grained Visual Categorization 工作坊中的 iFood-2019 挑战,并可供下载。
Jul, 2019
提出了一种基于图卷积网络的多标签分类模型,通过建立对象标签之间的图,学习一个对相互依赖的物体分类器的表示,同时使用重新加权的方法来创建有效的标签相关矩阵以指导 GCN 中节点之间的信息传播,在两个多标签图像识别数据集上实验证明了方法的有效性,并且可视化分析表明该模型学习到的分类器保持有意义的语义拓扑结构。
Apr, 2019
采用高斯和因果关注模型进行细粒度目标识别,使用反事实推理方法解决数据漂移问题,设计可学习的损失策略提高目标识别的准确性。在四个相关数据集上验证了方法,展示了其出色的性能。对于 ETH-FOOD101、UECFOOD256 和 Vireo-FOOD172 数据集,该方法超过了最先进方法;此外,该方法在 CUB-200 数据集上也达到了最新技术水平。
Mar, 2024
本文介绍了细粒度视觉分类在生物多样性和物种分析领域的挑战性应用,提出了适用于计算机视觉研究的两个具有 675 个高度相似类别的挑战性新数据集,并使用卷积神经网络(CNN)的局部特征呈现了首个结果。最后,我们提出了生物多样性研究中视觉分类领域的新挑战性研究方向清单。
Jul, 2015
本研究提供了一种可解释的深度模型,通过在深层神经网络中将基于区域的部件发现和归因结合起来实现细粒度视觉识别,并通过图像级对象标签进行训练,可以有效地识别图像中的对象部件,提高细粒度识别和对象部件定位的准确性。
May, 2020
本文提出了一种新颖的模型,使用交叉层双线性池化和分层双线性池化框架来帮助解决细粒度视觉识别的问题,同时在细粒度识别数据集上达到了最先进水平。
Jul, 2018
通过大量实验,我们发现将定制标签应用于 CNN 训练可以显著提高分类精度,优化和泛化能力,并且可以提高 CNN 训练的数据效率。提出了一种度量标准来描述细粒度标签的有效性,并通过大量实验进行了演示。
Jan, 2019