PointNetVLAD: 基于深度点云的大规模场所识别检索
本文提出了一种名为 LPD-Net 的深度神经网络,它可以从原始 3D 点云数据中提取判别性和可推广性的全局描述符,用于解决基于点云的识别任务,并与 PointNetVLAD 和基于视觉的解决方案进行了比较。
Dec, 2018
本文提出了一种高效的点云学习网络 (EPC-Net) 以形成全局描述符用于视觉地方识别,该网络具有良好的性能并且可以降低计算内存和推理时间,通过在代理点和空间相邻矩阵上进行简化的边缘卷积实现对点云本地几何特征的聚合,然后设计轻量级分组 VLAD 网络 (G-VLAD) 以形成检索的全局描述符。
Jan, 2021
比较三维点云方法和基于图像序列的方法在场所识别性能上的差异,结果表明对于特定度量跨度,基于图像序列的技术可以接近甚至超过基于点云的方法的表现。
Jun, 2021
提出了一种名为 MinkLoc3D 的基于学习的方法,用于计算具有区分性的三维点云描述符,该方法使用稀疏体素化的点云表示和稀疏三维卷积,相比目前最先进的方法具有更好的性能。
Nov, 2020
本文介绍了一种名为 Patch-NetVLAD 的方法,它提供了一种将局部和全局描述符方法的优点相结合的新方法,通过从 NetVLAD 剩余变量中导出局部级别的特征,我们的方法使深度学习的局部特征定义在特征空间网格上,能够聚合和匹配这些特征,并通过积分特征空间进行互补尺度(即块大小)的块特征的多尺度融合,显示出在其状态 - of-the-art 视觉地点识别结果上具有高度不变性,超过了基于全局和局部特征描述符的方法,同时还具有可配置框架中的改进计算效率,适合于增强独立场所识别能力和 SLAM 系统的整体性能。
Mar, 2021
本文提出了一种多分辨率特征金字塔编码视觉识别方法,称为 MultiRes-NetVLAD,可以更准确地匹配全球地点描述符,从而使 global descriptor based retrieval 能够达到最先进的召回率水平。
Feb, 2022
本文提出了一个新的卷积神经网络结构 NetVLAD,通过基于新的弱监督排序损失的训练过程,从 Google 街景中的时间机器下载的图片中,快速和准确地识别所查询照片的位置。同时,该网络结构在两个具有挑战性的地点识别基准测试中优于非学习图像表示和现成卷积神经网络描述符,同时也改善了标准图像检索基准测试上的现有最先进的紧凑图像表示。
Nov, 2015
在具有相似场景(如城市或室内场景)的区域中,视觉地点识别(VPR)是一个主要挑战,Patch-NetVLAD + 提出了一种微调策略和三元组损失,使 NetVLAD 适用于提取补丁级别描述符,并为 VPR 中至关重要的 LSR 分配适当的权重
Feb, 2022
该论文提出了一种解决全局定位问题的方法,通过使用基于 Siamese LocNets 的半手工表示学习方法,在全局先验地图中实现了场所识别和尺度姿态估计,并且提出了一个使用仅距离观测的全局定位框架。通过 KITTI 数据集和自主收集的多个数据集的实验结果表明,该系统能够实现高精度的全局定位。
Dec, 2017