图像检索的深度视觉表示端到端学习

ECCVOct, 2016

图像检索的深度视觉表示端到端学习

End-to-end Learning of Deep Visual Representations for Image Retrieval

Albert Gordo, Jon Almazan, Jerome Revaud, Diane Larlus

TL;DR本文针对深度学习在实例级图像检索方面表现不佳的问题，提出了基于大规模嘈杂地标数据集的清洗方法、改进的 R-MAC 描述符、基于三元组损失的孪生网络，并在 Oxford 5k、Paris 6k 和 Holidays 数据集上，分别报告了 94.7，96.6 和 94.8 的平均精度，并通过产品量化处理可以实现图像表示的高度压缩。

Abstract

While deep learning has become a key ingredient in the top performing methods for many computer vision tasks, it has failed so far to bring similar improvements to instance-level image retrieval. In this article,

deep learning image retrieval r-mac descriptor triplet loss global image representation

发现论文，激发创造

深度图像检索：学习全局图像表示以用于图像搜索

本文提出了一种新方法进行实例级别的图像检索，通过聚合多个基于区域的描述符为每个图像生成全局紧凑的固定长度表示，该方法基于一个特定图像检索任务训练的深度架构，利用排序框架来学习卷积和投影权重，并采用区域建议网络来学习应汇集哪些区域以形成最终的全局描述符。

Apr, 2016

高分辨率图像检索中基于 Triplet-loss 扩张残差网络的表示学习

本文提出了一种使用三元组损失（triplet loss）的卷积神经网络方法，该方法采用膨胀残差卷积神经网络（dilated residual convolutional neural network）提取高分辨率表示，并通过广义均值池化（Generalized-Mean pooling）方法增强提取的表示的鲁棒性，该方法在 Revisited Paris6k 和 UKBench 等数据集上取得良好的图像检索精度。

Mar, 2023

深度卷积神经网络的视觉实例检索

本文研究使用卷积网络所提供的图像表示在视觉实例检索任务中的可用性，并通过利用多尺度图像特征提取方案，特别地，通过将几何不变性纳入到明确的位置、尺度和空间一致性中的方法来提取来自于该网络的局部特征，实验结果表明，如果对其进行适当提取，那么通用卷积网络图像表示法可优于其他先进方法。

Dec, 2014

面向特定对象检索的上下文感知查询图像表示

通过人类视觉传递的信息流作为灵感，提出了一种基于 CNN 的特定目标检索方法，将注意力放在感兴趣的区域上可以显著提高检索的准确性，并且使用新颖的显着性度量对区域进行加权，进一步提高了检索的准确性。

Mar, 2017

卷积神经网络在视觉实例检索中的最佳实践是什么？

本文对多种因素对卷积神经网络（CNN）提取的特征代表性的影响进行了全面评估，提出了一种新的多尺度图像特征表示方法来有效编码图像，并在可视化目标检索的四个典型数据集上表现出了优异的性能。

Nov, 2016

使用三元组网络进行深度度量学习

本文提出了三元组网络模型，通过距离比较来学习有用的表示方法，在多个数据集上的结果显示其比竞争对手孪生网络学习了更好的表示方法，而且还探讨了其作为无监督学习框架的未来可能用途。

Dec, 2014

粗到细：学习单阶段图像检索的紧凑判别表示

本研究设计了一个用于单阶段图像检索的紧凑鉴别性表示学习框架，只需要图像级别的标签，通过动态调整损失尺度和边界、选择重要的局部描述符并注入细粒度语义关系，实现了全局尺度上的类间区分度优化，取得了在 Revisited Oxford 和 Revisited Paris 等基准测试中的最新单阶段图像检索性能。

Aug, 2023

重访牛津和巴黎：大规模图像检索基准测试

本文研究图像检索基准测试中的问题，特别是注释错误、数据集大小和难度水平等方面，并创建了新的数据集注释，引入了三个不同难度的协议以公平地比较不同方法，在新基准测试中进行了先进方法的广泛比较。

Mar, 2018

深度卷积网络在文件图像分类和检索中的评估

本文提出了一种利用深度卷积神经网络学习特征进行文档图像分类和检索的最新技术，证实与手工制作的替代方法相比，能够更好地学习抽象特征，且具有压缩鲁棒性和跨领域迁移性，并在新的 IIT-CDIP 数据集中提供了 400,000 个文档图像用于深度学习。

Feb, 2015

使用孪生 CNN 学习医学图像的深度特征并应用于基于内容的图像检索

使用深度 Siamese 卷积神经网络 (SCNN)，基于二值图像对信息，可以学习到更少监督的图像表示，并在医疗图像检索任务上取得了可比单一监督学习 CNN 的表现。

Nov, 2017