PointNetVLAD: 基于深度点云的大规模场所识别检索

CVPRApr, 2018

PointNetVLAD: 基于深度点云的大规模场所识别检索

PointNetVLAD: Deep Point Cloud Based Retrieval for Large-Scale Place Recognition

Mikaela Angelina Uy, Gim Hee Lee

TL;DR本研究提出了 PointNetVLAD 方法，结合 PointNet 和 NetVLAD 模型，通过端到端的训练和推理从给定的 3D 点云中提取全局描述符，并使用 “lazy triplet and quadruplet” 损失函数来实现更具有判别性和可推广性的全局描述符以解决点云识别的问题，并创建了基准数据集以实现其可行性。

Abstract

Unlike its image based counterpart, point cloud based retrieval for place recognition has remained as an unexplored and unsolved problem. This is largely due to the difficulty in extracting local feature descriptors from a point cloud that can subsequently be encoded into a

point cloud place recognition deep learning global descriptor benchmark

发现论文，激发创造

LPD-Net：大规模场景识别和环境分析的 3D 点云学习

本文提出了一种名为 LPD-Net 的深度神经网络，它可以从原始 3D 点云数据中提取判别性和可推广性的全局描述符，用于解决基于点云的识别任务，并与 PointNetVLAD 和基于视觉的解决方案进行了比较。

Dec, 2018

大规模场所识别的高效三维点云特征学习

本文提出了一种高效的点云学习网络 (EPC-Net) 以形成全局描述符用于视觉地方识别，该网络具有良好的性能并且可以降低计算内存和推理时间，通过在代理点和空间相邻矩阵上进行简化的边缘卷积实现对点云本地几何特征的聚合，然后设计轻量级分组 VLAD 网络 (G-VLAD) 以形成检索的全局描述符。

Jan, 2021

SeqNetVLAD vs PointNetVLAD: 白天黑夜场所识别中的图像序列与三维点云

比较三维点云方法和基于图像序列的方法在场所识别性能上的差异，结果表明对于特定度量跨度，基于图像序列的技术可以接近甚至超过基于点云的方法的表现。

Jun, 2021

MinkLoc3D：基于点云的大规模场所识别

提出了一种名为 MinkLoc3D 的基于学习的方法，用于计算具有区分性的三维点云描述符，该方法使用稀疏体素化的点云表示和稀疏三维卷积，相比目前最先进的方法具有更好的性能。

Nov, 2020

Patch-NetVLAD: 局部 - 全局特征的多尺度融合在地点识别中的应用

本文介绍了一种名为 Patch-NetVLAD 的方法，它提供了一种将局部和全局描述符方法的优点相结合的新方法，通过从 NetVLAD 剩余变量中导出局部级别的特征，我们的方法使深度学习的局部特征定义在特征空间网格上，能够聚合和匹配这些特征，并通过积分特征空间进行互补尺度（即块大小）的块特征的多尺度融合，显示出在其状态 - of-the-art 视觉地点识别结果上具有高度不变性，超过了基于全局和局部特征描述符的方法，同时还具有可配置框架中的改进计算效率，适合于增强独立场所识别能力和 SLAM 系统的整体性能。

Mar, 2021

MultiRes-NetVLAD: 使用低分辨率图像增强地点识别训练

本文提出了一种多分辨率特征金字塔编码视觉识别方法，称为 MultiRes-NetVLAD，可以更准确地匹配全球地点描述符，从而使 global descriptor based retrieval 能够达到最先进的召回率水平。

Feb, 2022

NetVLAD：用于弱监督地点识别的 CNN 架构

本文提出了一个新的卷积神经网络结构 NetVLAD，通过基于新的弱监督排序损失的训练过程，从 Google 街景中的时间机器下载的图片中，快速和准确地识别所查询照片的位置。同时，该网络结构在两个具有挑战性的地点识别基准测试中优于非学习图像表示和现成卷积神经网络描述符，同时也改善了标准图像检索基准测试上的现有最先进的紧凑图像表示。

Nov, 2015

Patch-NetVLAD+: 基于学习的补丁描述符和加权匹配策略的地点识别

在具有相似场景（如城市或室内场景）的区域中，视觉地点识别（VPR）是一个主要挑战，Patch-NetVLAD + 提出了一种微调策略和三元组损失，使 NetVLAD 适用于提取补丁级别描述符，并为 VPR 中至关重要的 LSR 分配适当的权重

Feb, 2022

基于语义图的三维点云地点识别

本文提出了一种基于语义图的三维点云场景识别方法，该方法具有鲁棒性，能够应对遮挡和视角变化等环境变化，评估结果表明该方法优于现有技术。

Aug, 2020

LocNet: 用于移动车辆的 3D 点云全局定位

该论文提出了一种解决全局定位问题的方法，通过使用基于 Siamese LocNets 的半手工表示学习方法，在全局先验地图中实现了场所识别和尺度姿态估计，并且提出了一个使用仅距离观测的全局定位框架。通过 KITTI 数据集和自主收集的多个数据集的实验结果表明，该系统能够实现高精度的全局定位。

Dec, 2017