关键补丁提供者:关键补丁包含丰富信息
通过不可区分的 Top-K 算子选择图像中最相关的部分,以高效处理高分辨率图像。 该方法可以与任何下游神经网络接口,以灵活的方式聚合不同补丁的信息,并允许整个模型使用反向传播进行端到端训练。该结果适用于交通标志识别,补丁之间的关系推理以及在训练期间不使用对象 / 部件边界框注释的细粒度识别。
Apr, 2021
本文提出了一种新的渐进式补丁学习方法来提高弱监督语义分割中的局部细节提取,进一步将特征破坏和补丁学习扩展到多级粒度,同时与多阶段优化策略相结合来提供模型对不同程度的特征提取能力。此方法超越了大多数现有的弱监督语义分割方法,在 PASCAL VOC 2012 数据集上取得了出色的表现。
Sep, 2022
本文提出了一个名为 KPN 的创新型 Kernel Proposal Network 用于任意形状文本检测,该方法通过预测高斯中心图,从嵌入特征图中提取候选动态卷积核以分离邻近文本实例,同时通过正交约束保证核的独立性,进而将各个核分别卷积输入特征图并生成文本实例的嵌入图,最终有效地解决了邻近文本实例粘连问题,并取得了优异的性能表现。
Mar, 2022
提出了一种名为 top-K 汇聚的 Vision Transformer 弱监督语义分割方法(TKP-PCL),通过使用 top-K 汇聚层来增强之前最大汇聚选择的限制,并提出了一种补丁对比误差(PCE)来增强补丁嵌入,从而进一步提高最终结果。实验结果表明,该方法在 PASCAL VOC 2012 数据集上非常高效,并且优于其他最新的弱监督语义分割方法。
Oct, 2023
在大规模仓库中,对于机器人的货箱拾取来说,精确的实例掩模至关重要,但往往很难获得。本文提出了一种新的基于补丁引导的实例分割解决方案 SKU-Patch,利用每个新的 SKU 仅需少量图像补丁来预测准确和稳健的掩模,避免了繁琐的手动操作和模型重训练。技术上,我们设计了一种新颖的基于 Transformer 的网络,具备(i)用于捕捉由补丁信息校准的多层次图像特征的图像补丁 - 图像相关编码器和(ii)带有并行任务头的补丁感知 Transformer 解码器,用于生成实例掩模。在四个仓库基准测试上进行的大量实验证明 SKU-Patch 能够在性能上超过现有最先进的方法。此外,SKU-Patch 在机器人辅助的自动货运管道中对 50 多个未见过的 SKU 的平均抓取成功率接近 100%,显示出其有效性和实用性。
Nov, 2023
本研究提出了一种新颖的无需提案的实例分割方法,其可处理跨越图像大部分并形成密集对象集群的复杂对象形状。该方法基于预测密集局部形状描述符,将其组装成实例。我们的方法是首个生成由学习的形状补丁组成的实例的非迭代方法,并在多个数据领域上进行了评估,其中定义了四个基准,分别是 ISBI 2012 EM 分割基准,BBBC010 C.elegans 数据集,以及二维和三维荧光显微镜图像的细胞核。此外,我们还展示了我们的方法也适用于展示了复杂形状集群极端案例的果蝇神经元的三维光学显微镜数据。
Jan, 2020
提出一种有效的基于 patch 的人脸图像质量评估算法,该算法综合考虑了人脸图像的几何对齐、锐度、头部姿势等因素,能够识别最正面、对齐、锐利和照明良好的图像,并在实验中表明在人脸子集的选择方面,该方法优于现有技术,使人脸识别准确度显著提高。
Apr, 2013
本研究提出了一种基于图像块的无监督图像分割策略,将深度聚类方法中无监督特征提取的进展与经典基于图形的方法的算法帮助相结合。我们展示了一个简单的卷积神经网络,通过使用图割来迭代地正则化图像块的分类,从而自然地实现了最先进的全卷积无监督像素级分割器。此外,我们证明了这是利用由视觉变换器模型生成的图像块级别对偶特征的理想场景。我们在真实图像数据上的结果证明了我们提出方法的有效性。
Nov, 2023
提出一种名为 Iterative Patch Selection (IPS) 的简单方法,该方法仅选择最显着的补丁,将其聚合成用于图像识别的全局表示,从而可以在硬件限制下处理任意大小的图像,展现出强大的性能和广泛的适用性,同时使用最少的加速器内存。
Oct, 2022
本文提出了一种基于弱监督的学习方法,通过将图像视为一个包中的实例将其融入到深度神经网络中,将弱监督的多实例学习约束与深度神经网络集成在一起,并采用端到端的方式优化网络以实现对象分类和发现任务。在 PASCAL VOC 数据集上的测试表明,该方法在对象分类方面可以获得最先进的性能,并且在对象发现方面也具有很强的竞争力,并且测试速度比竞争者更快。
May, 2017