Google Landmark Retrieval 2020 大赛第一名解决方案
该论文介绍了 Google 地标检索 2021 年 Kaggle 比赛的第二名解决方案,该解决方案基于具有训练技巧的基线,提出了一种根据国家标签选择训练图像的大陆感知的采样策略,并为检索任务提出了地标 - 国家感知的重新排名方法。在私人排行榜上,我们实现了 0.52995 mAP@100。可在此 https URL 中找到代码。
Oct, 2021
该论文探讨了图像检索的基本问题,提出了一种基于数据清洗和度量学习模型的解决方案,并采用一种名为 Corner-Cutmix 的数据增强方法,提高了模型识别多尺度和被遮挡地标图像的能力。
Aug, 2020
本文提出了一种通过两阶段鉴别性重新排列解决数据集多样性问题的大规模地标图像检索的有效流程,该方法基于使用余弦 softmax 损失训练的卷积神经网络嵌入特征空间中的图像,通过 $k$ 最近邻搜索和软投票对检索结果进行排序,然后通过从未通过图像相似性检索的数据集中添加附加样本的方式进行插入,以克服检索图像的低视觉多样性。经过深入的实验结果表明,所提出的方法在挑战性的 Google Landmarks 数据集上明显优于现有的方法。
Mar, 2020
smlyaka 团队基于深度卷积神经网络与度量学习构建了一个鲁棒的人工智能系统,这个系统在 Google Landmarks-v2 数据集噪声和多样性较高的情况下表现出更好的识别和检索效果,其包括自动数据清理系统和提高数据区分度的再排序方法,并在 Google Landmark Retrieval 2019 挑战赛中获得了第一名,并在 Kaggle 的 Google Landmark Recognition 2019 挑战赛中位列第三。
Jun, 2019
本文提出的方法在 Google Universal Images Embedding 竞赛中获得了第一名,并基于进行训练和微调的新方法,更好的集成模型池中的模型,高分辨率和重叠拼贴的微调之间潜在的权衡,以及适用于动态边际的潜在因素等多个方面进行了讨论。
Oct, 2022
提出了一种高效的端到端方法,用于标注和排序地标图像,采用卷积神经网络将图像嵌入到高维特征空间,并使用视觉相似性分类图像,采用相似性重新排名预测,过滤噪声。使用该方法在 2020 年的 Google 地标识别挑战赛中获得了第一名。
Oct, 2020
本文介绍了第二名在 Google 通用图像嵌入竞赛中的解决方案,主要探讨了数据建立,模型结构和训练策略对细粒度图像分类的影响,并在公共排行榜得分为 0.713,在私人排行榜得分为 0.709。
Oct, 2022
本文介绍了 Google Landmarks Dataset v2 (GLDv2),它是迄今为止最大的数据集,在人工制造和自然地标的领域内进行了大规模的、细粒度的实例识别和图像检索,并具有极长的类分布、大量的测试相片以及大内部类的变异性等具有挑战性的特性。
Apr, 2020
基于 CLIP 架构,使用 SubCenter ArcFace loss ,dynamic margins 和提高 transfer learning 策略,以 Google Universal Image Embedding 竞赛为基础,创建了多样化的数据集,最终在 Kaggle 的排名中获得第六名,私有排行榜得分为 0.685。
Oct, 2022
该研究介绍了一种先进的集成技术,用于解决 3D 图像重建问题,并综合审查了参与竞赛的顶级团队采用的现有方法和技术,为未来的参与者和研究人员在类似的图像匹配和重建挑战中取得优异成绩提供了宝贵的知识。
Jul, 2024