ECCVOct, 2016

图像检索的深度视觉表示端到端学习

TL;DR本文针对深度学习在实例级图像检索方面表现不佳的问题,提出了基于大规模嘈杂地标数据集的清洗方法、改进的 R-MAC 描述符、基于三元组损失的孪生网络,并在 Oxford 5k、Paris 6k 和 Holidays 数据集上,分别报告了 94.7,96.6 和 94.8 的平均精度,并通过产品量化处理可以实现图像表示的高度压缩。