重访牛津和巴黎的基于内容的像素检索
本文研究图像检索基准测试中的问题,特别是注释错误、数据集大小和难度水平等方面,并创建了新的数据集注释,引入了三个不同难度的协议以公平地比较不同方法,在新基准测试中进行了先进方法的广泛比较。
Mar, 2018
通过仅在稀疏像素位置提供标签,深度神经网络可以实现良好的语义分割性能,结合主动学习机制和高效注释策略可以大大减少标注成本,并在 CamVid,Cityscapes 和 PASCAL VOC 2012 数据集上进行了实验证明了相当可比的性能。
Apr, 2021
该论文介绍了一种新颖的方法,通过超图框架和社区选择技术,提高了图像检索和像素检索的效率和准确性。通过在查询时间中利用本地特征有效地传播空间信息,准确地检索和定位数据库中的对象,从而在图像级和像素级检索中实现了最先进的准确性。
Jun, 2024
本研究基于半监督度量学习方法,提出了四种对应关系来捕捉低 - level 图像相似性、语义标注、共现和特征亲和力。这些节点可以从任何部分注释的训练图像中以数据驱动的方式进行学习,因此,该模型不仅适用于弱监督分割中标记的像素,还适用于未标记的像素。
May, 2021
该研究致力于解决在给定用户注释指向感兴趣的物体的情况下的视频对象分割问题。作者提出了一种基于学习嵌入空间的像素级检索方法,并使用全卷积网络作为嵌入模型,使用修改后的三元组损失进行训练。作者提出的方法支持不同类型的用户输入,如在第一帧中的分割遮罩(半监督情况下),或者一个稀疏的点击点集合(交互情况下),并在计算成本上获得了很好的结果。在半监督场景中,该方法达到了与现有技术相比竞争性的结果,但计算成本仅为每帧 275 毫秒。在交互式场景中,该方法能够实时响应用户的每个输入,并达到了与竞争方法相当的质量,但交互程度要少得多。
Apr, 2018
该研究论文研究了视觉定位中图像检索方法对定位性能的影响,并提出了专为定位场景设计的检索方法的需求。通过引入基准测试和多种 “地面真实性” 定义以及针对经典地标检索或地点识别任务的检索效能的分析,探讨了这种影响。
May, 2022
提出一种新型半监督语义分割方法,结合像素级 L2 损失和像素对比损失以实现两个分割模型规则:图像增强之间的标签空间一致性性质和不同像素之间的特征空间对比性质,采用 DeepLab-v3+ 结构和多个数据集进行了广泛的实验,表现出最先进的性能。
Aug, 2021
本研究提出了一种半监督语义分割的新方法,采用对比学习模块,通过维护持续更新的内存库,将具有相同类别的样本的像素级特征表示相似,通过端到端的训练,优化标注和未标注数据的特征,能够在公共基准测试中取得比半监督语义分割和半监督领域适应的现有技术更好的表现,尤其在标注数据较少的情况下有更大的提升。
Apr, 2021