Google Landmark Retrieval 2021 第二名解决方案
使用度量学习、迁移学习、微调、集成等方法,通过分类数码标志以提高模型性能,最终在 Google Landmark 检索比赛中获得第 1 名,并获得 0.38677 的 mAP@100 得分。
Aug, 2020
该论文探讨了图像检索的基本问题,提出了一种基于数据清洗和度量学习模型的解决方案,并采用一种名为 Corner-Cutmix 的数据增强方法,提高了模型识别多尺度和被遮挡地标图像的能力。
Aug, 2020
本文提出了一种通过两阶段鉴别性重新排列解决数据集多样性问题的大规模地标图像检索的有效流程,该方法基于使用余弦 softmax 损失训练的卷积神经网络嵌入特征空间中的图像,通过 $k$ 最近邻搜索和软投票对检索结果进行排序,然后通过从未通过图像相似性检索的数据集中添加附加样本的方式进行插入,以克服检索图像的低视觉多样性。经过深入的实验结果表明,所提出的方法在挑战性的 Google Landmarks 数据集上明显优于现有的方法。
Mar, 2020
提出了一种高效的端到端方法,用于标注和排序地标图像,采用卷积神经网络将图像嵌入到高维特征空间,并使用视觉相似性分类图像,采用相似性重新排名预测,过滤噪声。使用该方法在 2020 年的 Google 地标识别挑战赛中获得了第一名。
Oct, 2020
smlyaka 团队基于深度卷积神经网络与度量学习构建了一个鲁棒的人工智能系统,这个系统在 Google Landmarks-v2 数据集噪声和多样性较高的情况下表现出更好的识别和检索效果,其包括自动数据清理系统和提高数据区分度的再排序方法,并在 Google Landmark Retrieval 2019 挑战赛中获得了第一名,并在 Kaggle 的 Google Landmark Recognition 2019 挑战赛中位列第三。
Jun, 2019
本文介绍了第二名在 Google 通用图像嵌入竞赛中的解决方案,主要探讨了数据建立,模型结构和训练策略对细粒度图像分类的影响,并在公共排行榜得分为 0.713,在私人排行榜得分为 0.709。
Oct, 2022
本文介绍了 Google Landmarks Dataset v2 (GLDv2),它是迄今为止最大的数据集,在人工制造和自然地标的领域内进行了大规模的、细粒度的实例识别和图像检索,并具有极长的类分布、大量的测试相片以及大内部类的变异性等具有挑战性的特性。
Apr, 2020
本文提出的方法在 Google Universal Images Embedding 竞赛中获得了第一名,并基于进行训练和微调的新方法,更好的集成模型池中的模型,高分辨率和重叠拼贴的微调之间潜在的权衡,以及适用于动态边际的潜在因素等多个方面进行了讨论。
Oct, 2022
本研究提出了一种多分支检索方法,通过组合全局描述符和局部描述符来应对大规模数据以及图像复制攻击的挑战,其中包括丰富的数据增强和自监督学习等优化策略,并引入了鲁棒性较强的 SIFT 特征和 GPU Faiss 进行局部检索,在使用 KNN 匹配算法来判断匹配和合并分数时,我们展示了一些我们方法的消融实验,揭示了全局和局部特征的互补优势。
Dec, 2021
本文通过提供新的地标边界框数据集,展示了如何使用训练良好的地标探测器,在基于地标的检索系统中更高效地获取图像区域,并引入了一种新的区域聚合选择匹配核 (R-ASMK) 来提高图像检索精度。该图像检索系统在 Revisited Oxford 和 Paris 数据集上显著超越了之前的最新技术。
Dec, 2018