使用三维先验增强二维表示学习

Jun, 2024

Enhancing 2D Representation Learning with a 3D Prior

Mehmet Aygün, Prithviraj Dhar, Zhicheng Yan, Oisin Mac Aodha, Rakesh Ranjan

TL;DR通过在训练过程中直接强制将强大的三维结构先验性知识融入模型，我们提出了一种新的方法来加强现有的自监督学习方法，并通过一系列数据集实验证明了我们的三维感知表示比传统的自监督基线更加稳健。

Abstract

Learning robust and effective representations of visual data is a fundamental task in computer vision. Traditionally, this is achieved by training models with labeled data which can be expensive to obtain.

self-supervised learning visual data 3d structural prior robust representations computer vision

发现论文，激发创造

医学影像的 3D 自监督方法

本文提出了针对五种不同的自监督学习方法的三维版本，利用这些技术进行神经网络特征的学习，通过对三维图像的预处理，显著提高语义表示的精确性，从而在医学成像领域实现了数据效率、性能和收敛速度的提升，具有较高的竞争力和可扩展性。

Jun, 2020

视角到标签：自监督三维物体检测的多视角一致性

提出了一种基于多视角和弱标签的纯 RGB 序列的自监督 3D 物体检测方法，其在 KITTI 3D 数据集上的性能与使用激光雷达或立体图像的最先进的自监督方法相当。

May, 2023

从图像中进行的无监督三维结构学习

本文提出一种从 2D 图像中学习生成 3D 结构的深度生成模型，并通过概率推断从 3D 和 2D 图像中恢复这些结构，从而实现了第一个纯无监督学习下学习推断 3D 表示的方法，并在几个数据集上建立了基准模型。

Jul, 2016

自监督单目深度的语义引导表示学习

本文研究自监督学习中如何直接运用语义结构来指导几何表示的学习，提出了一种新的基于预训练语义分割网络和像素自适应卷积的架构，并使用两阶段训练过程来克服动态对象上的常见语义偏差。结果表明该方法在所有像素、细节和语义类别上都优于现有方法，实现了自监督单目深度预测的最新水平。

Feb, 2020

联合监督与自监督学习 3D 现实世界挑战

本文介绍了基于自监督式多任务模型的方法，用于解决数据稀缺性和跨域数据集问题，提高 3D 形状分类与部分分割的效果。

Apr, 2020

跨模态和跨视角自监督特征学习

通过利用跨模式和视角的对应关系，该论文提出了一种新颖且有效的自监督学习方法，联合学习 2D 图像特征和 3D 点云特征，并通过神经网络评估跨模态的对应关系，而无需使用人工标注标签。

Apr, 2020

自助学习多模态预训练在 3D 目标检测中的应用

通过使用与图像相关的 shelf-supervision 模型对配对的 RGB 和 LiDAR 数据进行无监督预训练，我们提出了一种能够生成零样本 3D 边界框的点云表示方法，这种方法在半监督检测中能够显著提高检测准确性，尤其适用于 LiDAR-only 和多模态 (RGB + LiDAR) 检测。我们在 nuScenes 和 WOD 上展示了我们方法的有效性，并在有限数据环境中明显改进了之前的工作。

Jun, 2024

自监督学习用于预训练 3D 点云：综述

本研究综述了使用深度神经网络实现无监督点云表示学习的方法，解决在人工标注数据量有限的问题。研究挖掘了常用数据集和评估指标，提出了基于这些技术的自监督点云表示学习方法的广泛应用，并指出未来可能面临的挑战和潜在问题。

May, 2023

任意点云的自监督 3D 特征预训练

该研究提出了一种可用于 3D 数据的简单自监督预训练方法，在目标检测、语义分割和物体分类等方面取得了最先进的结果并提高了少样本类别的性能。

Jan, 2021

3D 点云时空自监督表示学习

本文介绍了一种利用自监督学习学习无标签 3D 点云的时空表示学习 (STRL) 框架，通过从 3D 数据中获得富含的时空线索来应对 3D 情景理解任务中预训练模型泛化性差的困境，实验证明该方法能显著提高 3D 点云中的表示学习性能。

Sep, 2021