图像搜索中深度局部和全局特征的统一
本文提出了一种深度正交局部全局信息融合框架(DOLG),通过一步到位的方式将图像的本地信息和全局信息结合起来,有效地解决了图像检索中的相关问题,该模型在经过广泛实验验证后,表现出良好的检索效果。
Aug, 2021
本文提出了一种新方法进行实例级别的图像检索,通过聚合多个基于区域的描述符为每个图像生成全局紧凑的固定长度表示,该方法基于一个特定图像检索任务训练的深度架构,利用排序框架来学习卷积和投影权重,并采用区域建议网络来学习应汇集哪些区域以形成最终的全局描述符。
Apr, 2016
本文介绍了一种基于超级特征的深度图像检索架构,只需要图像标签即可训练。超级特征由迭代的注意模块构建,通过对 Super-features 实施对比损失来匹配图像。与局部特征相比,这种方法在存储空间方面具有显着优势,并在常见地标检索基准上表现出比现有方法更好的效果。
Jan, 2022
我们提出了一种基于卷积神经网络的关注局部特征描述符 DELF,它可以作为关键点探测器和描述符的一种替代品,能够产生可靠的置信度得分,能够有效地进行图像检索。我们对 Google-Landmarks 数据集进行了测试,结果表明 DELF 在大规模情况下优于最先进的全局和局部描述符。
Dec, 2016
通过利用全局特征实现精确且轻量级的图像检索,本研究提出了一种名为 SuperGlobal 的图像检索范式,通过精细的再排序阶段来提高性能,并在标准基准测试中取得了显著的改进。
Aug, 2023
本研究提出了一种新型的三层深度学习模型,通过引入一对多二元类别学习器,学习遗传算法优化的特征,并同时学习全局和局部上下文信息,从而优化整个模型以在图像分割方面取得有希望的结果。
Apr, 2022
我们提出了一种高效的端到端管道,用于大规模地标识别和检索,演示如何结合和增强最近图像检索研究中的概念并介绍两种特别适用于大规模地标识别的架构:深度正交融合的全局和局部特征模型(DOLG)使用 EfficientNet 骨干和一种新的混合 Swin 变换器,讨论了如何使用逐步方法高效地训练两种架构,并提供了一个具有动态边缘的子中心 Arcface 损失,此外还详细阐述了一种新的判别式重新排名方法用于图像检索,我们的方法通过赢得 Google Landmark 竞赛 2021 的识别和检索赛道证明了其卓越性。
Oct, 2021
本文研究采用卷积神经网络在图像检索中的应用,通过提取不同层的卷积特征,使用 VLAD 编码转化为一个单一向量,探讨不同层和规模在特征处理中的影响,发现较低的层次和更精细的尺度能够更好地提升图像检索的准确度,同时对比了其他方法,最终取得了业界领先的成果。
Apr, 2015