本文提出了一种新方法进行实例级别的图像检索,通过聚合多个基于区域的描述符为每个图像生成全局紧凑的固定长度表示,该方法基于一个特定图像检索任务训练的深度架构,利用排序框架来学习卷积和投影权重,并采用区域建议网络来学习应汇集哪些区域以形成最终的全局描述符。
Apr, 2016
本文提出一种轻量级全局描述符,以建模跨不同维度(如通道、帧)之间的位置交互作用,使得后续卷积能够合理地访问此全局特征,从而在计算成本和参数数量上有了巨大的降低,也完成了最有效的长距离机制。
Jul, 2019
该文提出了一个名为 DELG 的新模型,将全局和本地特征统一为一个深度模型,同时提出了一种自编码器的降维技术,该模型在图像检索和识别方面的表现都达到了最新的水平。
Jan, 2020
本研究提出了一个框架,该框架将多种基于纹理的技术与 CNN 主干结合起来,以提取与图像纹理相关联的最相关特征,使模型可以以自我选择的方式进行训练,并在几个基准数据集上展现了最新的成果。
Jun, 2022
提出了一个端到端的框架,用于学习 3D 点云的本地多视图描述符。利用可微分的渲染器将多视图表示集成到神经网络中,设计了软视图池化模块来聚合视角间的卷积特征,实验结果表明,本文方法在现有的 3D 配准基准上更优秀。
Mar, 2020
通过利用全局特征实现精确且轻量级的图像检索,本研究提出了一种名为 SuperGlobal 的图像检索范式,通过精细的再排序阶段来提高性能,并在标准基准测试中取得了显著的改进。
Aug, 2023
提出了基于全局和局部特征表示的多网络对比学习框架,通过多个网络引入自监督对比学习的全局和局部特征信息,并通过对比由多个网络生成的嵌入对来学习图像不同尺度上的特征信息,并扩展对比样本数,提高了模型的训练效率。在三个基准数据集上的线性评估结果表明,我们的方法优于几种现有的经典自监督学习方法。
Jun, 2023
本文通过对局部卷积神经网络特征进行聚合研究,提出一种基于简单加总池化的高效图像检索方法,取得了显著提升的效果。
Oct, 2015
该篇论文提出了一种用于实例级别识别的高效学习本地描述符的方法,它使用度量学习来训练深度神经网络,通过内部组件的激活传递局部描述符。与现有本地描述符相比,在两个实例级别识别任务中提供更好的性能和更低的存储器需求,这证明了全局描述符在大规模情况下不够有效,适当的局部性是不可或缺的。
Jul, 2020
本文针对深度学习在实例级图像检索方面表现不佳的问题,提出了基于大规模嘈杂地标数据集的清洗方法、改进的 R-MAC 描述符、基于三元组损失的孪生网络,并在 Oxford 5k、Paris 6k 和 Holidays 数据集上,分别报告了 94.7,96.6 和 94.8 的平均精度,并通过产品量化处理可以实现图像表示的高度压缩。
Oct, 2016