Sep, 2023

图像检索的排名损失优化

TL;DR图像检索中,标准评估指标依赖于分数排名,如平均精度(AP)、前 k 个结果的召回率(R@k)、归一化折现累积增益(NDCG)。本研究引入了一种用于鲁棒且可分解的排名损失优化的通用框架,解决了端到端训练深度神经网络时面临的两个主要挑战:非可微性和非可分解性。首先,我们提出了一种通用的排名操作符替代品 SupRank,它适用于随机梯度下降,提供了排名损失的上界并保证了鲁棒训练。其次,我们使用一个简单而有效的损失函数来减小排名损失的批次平均近似与整个训练集上的损失值之间的可分解性差距。我们将我们的框架应用于图像检索的两个标准指标:AP 和 R@k。此外,我们还将我们的框架应用于分层图像检索。我们引入了 AP 的扩展,即分层平均精度 H-AP,并对其以及 NDCG 进行了优化。最后,我们创建了第一个分层地标检索数据集。我们使用半自动流程创建分层标签,扩展了大规模的 Google Landmarks v2 数据集。该分层数据集可在此 URL 公开获取。代码将在此 URL 发布。