自我监督表示学习的视觉地理定位
介绍了一种新方法,利用深度卷积神经网络对整张图片进行训练,以在不额外进行人工监督的情况下定位图像中的物体,并将该思想嵌入凝聚聚类技术中,产生自学习定位假设。实验证明,使用我们的方法自动生成的注释可用于训练物体探测器,产生接近于手动注释的边界框的识别结果。
Sep, 2014
本文提出了一种新的基于密集局部特征的图像匹配方法,名为GeoWarp,旨在解决视觉地理定位中的视角不变性问题,并通过新的自监督损失和两种新的弱监督损失进行训练。实验证明,GeoWarp可以提高先进检索架构的准确性。
Sep, 2021
在这篇论文中,我们构建了一个30倍于现有最大数据集的San Francisco eXtra Large数据集,研究了现有的技术在实际城市范围内的视觉定位应用中的性能表现,并设计了一种高度可扩展的训练技术 CosPlace,它将训练模型作为分类问题,避免了常用对比学习的昂贵挖掘技术,这种技术在多个数据集上均能实现最先进的表现,并且相对于现有技术,它需要的GPU内存减少了约80%,且在描述符更小的情况下取得更好的结果。
Apr, 2022
本文提出了一个新的开源基准测试框架,用于视觉地理定位,目的是建立一个系统性的评估协议,比较不同方法在性能(召回率@N度量)和系统要求方面的差异,并通过使用该框架执行一系列实验来提供选择使用avebackone, 见识和负面开采的标准。同时,通过数据增强等工程技术,可以获得更好的性能。
Apr, 2022
本研究提出了一种基于学习的直接定位方法, 使用简单的网络D2S来表示本地描述符和场景坐标, 通过选择性关注鲁棒描述符并忽略云、树木和其他动态物体的方法, 完成了稀疏描述符的二元-语义分类, 在室内和室外环境中超越了现有的基于CNN的方法。
Jul, 2023
使用自我监督学习方案对人工智能进行了重要进展,将对比学习整合到现有的自我监督学习模型中,在计算机视觉领域取得了显著的进展,通过提出的模型 Segmentation Localization 对密集预测的语义分割任务进行了评估,并通过实现每个类别一个队列的思想在 MoCo-v2 中避免了假阴性对。
Oct, 2023
本文提出了一种运行时和数据高效的分层视觉场所识别(VPR)管道,通过结合数据驱动和免训练方法,在降低训练数据和影响训练与应用阶段分布差异方面取得了良好的平衡,该方法在大规模应用中表现出了更好的性能。
Mar, 2024
在本研究中,我们提出了一种自监督学习框架,通过仅利用无标签数据训练一个可学习的适配器,将不同视角的特征分布映射到一个统一空间,以应对交叉视图地理定位中的挑战。实验证明,我们的方法在减少训练参数和仅仅依靠无标签数据的情况下,相较于标准模型和有监督方法,在性能上取得了显著改进,并展示了广泛的应用潜力。
Mar, 2024
本研究解决了地理空间数据标记稀缺的问题,强调自监督学习(SSL)在地理空间人工智能(GeoAI)中的重要性。论文系统性地分类并评估了关于点、折线和多边形三种主要几何数据类型的SSL技术,提出将SSL与GeoAI相结合的创新方法,期望推动未来研究的发展。研究结果显示,SSL能够显著提升在各种下游任务中的泛化能力。
Aug, 2024