图像搜索中深度局部和全局特征的统一

ECCVJan, 2020

图像搜索中深度局部和全局特征的统一

Unifying Deep Local and Global Features for Image Search

Bingyi Cao, Andre Araujo, Jack Sim

TL;DR该文提出了一个名为 DELG 的新模型，将全局和本地特征统一为一个深度模型，同时提出了一种自编码器的降维技术，该模型在图像检索和识别方面的表现都达到了最新的水平。

Abstract

image retrieval is the problem of searching an image database for items that are similar to a query image. To address this task, two main types of image representations have been studied: global and local image features. In this work, our key contribution is to unify global and

image retrieval global features local features deep learning dimensionality reduction

发现论文，激发创造

DOLG: 深度正交局部和全局特征融合的单阶段图像检索

本文提出了一种深度正交局部全局信息融合框架（DOLG），通过一步到位的方式将图像的本地信息和全局信息结合起来，有效地解决了图像检索中的相关问题，该模型在经过广泛实验验证后，表现出良好的检索效果。

Aug, 2021

深度图像检索：学习全局图像表示以用于图像搜索

本文提出了一种新方法进行实例级别的图像检索，通过聚合多个基于区域的描述符为每个图像生成全局紧凑的固定长度表示，该方法基于一个特定图像检索任务训练的深度架构，利用排序框架来学习卷积和投影权重，并采用区域建议网络来学习应汇集哪些区域以形成最终的全局描述符。

Apr, 2016

学习图像检索的超级特征

本文介绍了一种基于超级特征的深度图像检索架构，只需要图像标签即可训练。超级特征由迭代的注意模块构建，通过对 Super-features 实施对比损失来匹配图像。与局部特征相比，这种方法在存储空间方面具有显着优势，并在常见地标检索基准上表现出比现有方法更好的效果。

Jan, 2022

具关注力的深度局部特征进行大规模图像检索

我们提出了一种基于卷积神经网络的关注局部特征描述符 DELF，它可以作为关键点探测器和描述符的一种替代品，能够产生可靠的置信度得分，能够有效地进行图像检索。我们对 Google-Landmarks 数据集进行了测试，结果表明 DELF 在大规模情况下优于最先进的全局和局部描述符。

Dec, 2016

全球特征对于图像检索和重排是必需的

通过利用全局特征实现精确且轻量级的图像检索，本研究提出了一种名为 SuperGlobal 的图像检索范式，通过精细的再排序阶段来提高性能，并在标准基准测试中取得了显著的改进。

Aug, 2023

基于遗传算法的特征选择和上下文集成的深度学习模型

本研究提出了一种新型的三层深度学习模型，通过引入一对多二元类别学习器，学习遗传算法优化的特征，并同时学习全局和局部上下文信息，从而优化整个模型以在图像分割方面取得有希望的结果。

Apr, 2022

具有深度特征正交性和混合 Swin 转换器的高效大规模图像检索

我们提出了一种高效的端到端管道，用于大规模地标识别和检索，演示如何结合和增强最近图像检索研究中的概念并介绍两种特别适用于大规模地标识别的架构：深度正交融合的全局和局部特征模型（DOLG）使用 EfficientNet 骨干和一种新的混合 Swin 变换器，讨论了如何使用逐步方法高效地训练两种架构，并提供了一个具有动态边缘的子中心 Arcface 损失，此外还详细阐述了一种新的判别式重新排名方法用于图像检索，我们的方法通过赢得 Google Landmark 竞赛 2021 的识别和检索赛道证明了其卓越性。

Oct, 2021

利用深度网络中的本地特征进行图像检索

本文研究采用卷积神经网络在图像检索中的应用，通过提取不同层的卷积特征，使用 VLAD 编码转化为一个单一向量，探讨不同层和规模在特征处理中的影响，发现较低的层次和更精细的尺度能够更好地提升图像检索的准确度，同时对比了其他方法，最终取得了业界领先的成果。

Apr, 2015

深度卷积特征聚合的图像检索

本文通过对局部卷积神经网络特征进行聚合研究，提出一种基于简单加总池化的高效图像检索方法，取得了显著提升的效果。

Oct, 2015

深度本地视频特征用于动作识别

探讨使用 CNN 特征表示整个视频以用于人类动作识别的问题，通过提取局部特征并将它们聚合成全局特征，将另一个映射函数用于将全局特征映射到全局标签

Jan, 2017