挖掘区分性细节补丁三元组以进行细粒度分类
本文旨在发现一组具有判别性的补丁,用作完全无监督的中级视觉表示,通过对图像补丁数据集进行无监督聚类和训练判别分类器来证明其有效性,进而能用于许多任务中代替视觉单词,并且在 MIT Indoor-67 数据集上展示了其在场景分类等任务中的最新性能。
May, 2012
本文提出了一种新颖的细粒度视觉分类框架,其中包括渐进式训练策略和随机拼图补丁生成器,以有效地融合不同粒度的特征,并在多个标准的细粒度视觉分类数据集上取得了最先进的性能表现。
Mar, 2020
本文提出了一种基于弱监督的学习方法,通过将图像视为一个包中的实例将其融入到深度神经网络中,将弱监督的多实例学习约束与深度神经网络集成在一起,并采用端到端的方式优化网络以实现对象分类和发现任务。在 PASCAL VOC 数据集上的测试表明,该方法在对象分类方面可以获得最先进的性能,并且在对象发现方面也具有很强的竞争力,并且测试速度比竞争者更快。
May, 2017
本文提出了一种使用深度神经网络应用视觉注意力于细粒度分类任务的新管道,通过整合三种类型的注意力,训练领域特定的深度网络,在弱监督约束下避免使用昂贵的注释,并在 ILSVRC2012 数据集和 CUB200_2011 数据集的子集上验证了该方法的有效性,取得了与其他方法相竞争的表现。
Nov, 2014
基于自主车辆的关键挑战是准确检测环境中的物体。我们引入 PatchContrast,这是一个创新的自我监督点云预训练框架,用于 3D 物体检测。通过提出两个抽象层次的利用,我们学习未标记数据的判别性表示:提案级别和补丁级别。提案级别旨在确定物体相对于周围环境的位置,而补丁级别增加了关于物体组件之间内部连接的信息,从而根据它们的独立组件区分不同的对象。我们展示了如何将这些级别集成到自我监督预训练中以增强下游的 3D 检测任务,并证明我们的方法在三个常用的 3D 检测数据集上优于现有的最先进模型。
Aug, 2023
这篇论文介绍了 OpenPatch 方法,它使用预训练模型从中间特征中提取一组描述每个已知类别的补丁表示,在新样本中评估其是否主要由单个已知类别的补丁构成或通过多个类别的贡献来组成,并通过广泛的实验评估展示了其在语义新颖性检测任务中的出色性能。
Oct, 2023
本文提出了一种卷积网络框架,用于学习二进制补丁描述符,其中像素域特征与从变换域提取的特征融合。实验证明,我们的特征融合方法在准确性、速度和复杂性方面优于多种最先进的方法。
Jan, 2019
本文提出了一种新的插件模块,可集成到 CNN 或 Transformer 等常见的后背网络中,输出像素级特征图并融合过滤后的特征以增强细粒度视觉分类,实验结果表明所提出的插件模块优于现有方法,可显着提高准确性。
Feb, 2022
本文提出了一种新的渐进式补丁学习方法来提高弱监督语义分割中的局部细节提取,进一步将特征破坏和补丁学习扩展到多级粒度,同时与多阶段优化策略相结合来提供模型对不同程度的特征提取能力。此方法超越了大多数现有的弱监督语义分割方法,在 PASCAL VOC 2012 数据集上取得了出色的表现。
Sep, 2022
本文研究了图像分类或搜索领域中基于编码方法(如词袋或 Fisher 向量)的流水线。我们提出并评估了一些用于密集提取图像路径的替代选择,包括基于超像素、边缘和 Zernike 滤波器的方法,并在最近的图像检索和细分分类基准上进行了评估。结果表明,大多数情况下,常规的密集探测器被其他方法超越,在标准检索和细粒度基准上改进了现有技术水平。此外,我们表明,如果沿着边缘而不是在检测到的区域周围提取路径,则现有的斑点和超像素提取方法可以实现高精度。
Oct, 2014