重访牛津和巴黎的基于内容的像素检索

Sep, 2023

重访牛津和巴黎的基于内容的像素检索

Towards Content-based Pixel Retrieval in Revisited Oxford and Paris

Guoyuan An, Woo Jae Kim, Saelyne Yang, Rong Li, Yuchi Huo...

TL;DR该论文引入了第一个像素检索基准，通过标注相关像素可以显著提高用户体验，并且提出了基于 ROxford 和 RParis 数据集的 PROxford 和 PRParis 像素检索基准，通过实验证明像素检索任务具有挑战性并且与现有问题有区别。

Abstract

This paper introduces the first two pixel retrieval benchmarks. Pixel retrieval is segmented instance retrieval. Like semantic segmentation

pixel retrieval segmented instance retrieval image retrieval semantic segmentation user study

发现论文，激发创造

重访牛津和巴黎：大规模图像检索基准测试

本文研究图像检索基准测试中的问题，特别是注释错误、数据集大小和难度水平等方面，并创建了新的数据集注释，引入了三个不同难度的协议以公平地比较不同方法，在新基准测试中进行了先进方法的广泛比较。

Mar, 2018

几个像素就够了：使用 PixelPick 进行语义分割

通过仅在稀疏像素位置提供标签，深度神经网络可以实现良好的语义分割性能，结合主动学习机制和高效注释策略可以大大减少标注成本，并在 CamVid，Cityscapes 和 PASCAL VOC 2012 数据集上进行了实验证明了相当可比的性能。

Apr, 2021

探索跨图像像素对比用于语义分割

提出了一个利用对比学习实现像素级别度量学习的语义分割框架，能够从全局上探索标记像素的结构，并在多个数据集上带来了显著的性能改进。

Jan, 2021

视觉定位图像检索基准测试

通过针对视觉定位任务设计的检索方法，对知名的图像检索技术在多个数据集上进行了对比，发现经典的标志性目标的检索效果与定位效果并不完全匹配。

Nov, 2020

基于空间和不确定性意识的精确快速像素检索的超图扩散

该论文介绍了一种新颖的方法，通过超图框架和社区选择技术，提高了图像检索和像素检索的效率和准确性。通过在查询时间中利用本地特征有效地传播空间信息，准确地检索和定位数据库中的对象，从而在图像级和像素级检索中实现了最先进的准确性。

Jun, 2024

基于像素到分割对比学习的通用弱监督分割

本研究基于半监督度量学习方法，提出了四种对应关系来捕捉低 - level 图像相似性、语义标注、共现和特征亲和力。这些节点可以从任何部分注释的训练图像中以数据驱动的方式进行学习，因此，该模型不仅适用于弱监督分割中标记的像素，还适用于未标记的像素。

May, 2021

使用像素度量学习的快速视频目标分割

该研究致力于解决在给定用户注释指向感兴趣的物体的情况下的视频对象分割问题。作者提出了一种基于学习嵌入空间的像素级检索方法，并使用全卷积网络作为嵌入模型，使用修改后的三元组损失进行训练。作者提出的方法支持不同类型的用户输入，如在第一帧中的分割遮罩（半监督情况下），或者一个稀疏的点击点集合（交互情况下），并在计算成本上获得了很好的结果。在半监督场景中，该方法达到了与现有技术相比竞争性的结果，但计算成本仅为每帧 275 毫秒。在交互式场景中，该方法能够实时响应用户的每个输入，并达到了与竞争方法相当的质量，但交互程度要少得多。

Apr, 2018

探究图像检索对视觉定位的作用 —— 一个详尽的基准测试

该研究论文研究了视觉定位中图像检索方法对定位性能的影响，并提出了专为定位场景设计的检索方法的需求。通过引入基准测试和多种 “地面真实性” 定义以及针对经典地标检索或地点识别任务的检索效能的分析，探讨了这种影响。

May, 2022

像素对比一致性半监督语义分割

提出一种新型半监督语义分割方法，结合像素级 L2 损失和像素对比损失以实现两个分割模型规则：图像增强之间的标签空间一致性性质和不同像素之间的特征空间对比性质，采用 DeepLab-v3+ 结构和多个数据集进行了广泛的实验，表现出最先进的性能。

Aug, 2021

基于类别内存库的像素级对比学习的半监督语义分割

本研究提出了一种半监督语义分割的新方法，采用对比学习模块，通过维护持续更新的内存库，将具有相同类别的样本的像素级特征表示相似，通过端到端的训练，优化标注和未标注数据的特征，能够在公共基准测试中取得比半监督语义分割和半监督领域适应的现有技术更好的表现，尤其在标注数据较少的情况下有更大的提升。

Apr, 2021