使用三维先验增强二维表示学习
本文提出了针对五种不同的自监督学习方法的三维版本,利用这些技术进行神经网络特征的学习,通过对三维图像的预处理,显著提高语义表示的精确性,从而在医学成像领域实现了数据效率、性能和收敛速度的提升,具有较高的竞争力和可扩展性。
Jun, 2020
提出了一种基于多视角和弱标签的纯 RGB 序列的自监督 3D 物体检测方法,其在 KITTI 3D 数据集上的性能与使用激光雷达或立体图像的最先进的自监督方法相当。
May, 2023
本文提出一种从 2D 图像中学习生成 3D 结构的深度生成模型,并通过概率推断从 3D 和 2D 图像中恢复这些结构,从而实现了第一个纯无监督学习下学习推断 3D 表示的方法,并在几个数据集上建立了基准模型。
Jul, 2016
本文研究自监督学习中如何直接运用语义结构来指导几何表示的学习,提出了一种新的基于预训练语义分割网络和像素自适应卷积的架构,并使用两阶段训练过程来克服动态对象上的常见语义偏差。结果表明该方法在所有像素、细节和语义类别上都优于现有方法,实现了自监督单目深度预测的最新水平。
Feb, 2020
通过利用跨模式和视角的对应关系,该论文提出了一种新颖且有效的自监督学习方法,联合学习 2D 图像特征和 3D 点云特征,并通过神经网络评估跨模态的对应关系,而无需使用人工标注标签。
Apr, 2020
通过使用与图像相关的 shelf-supervision 模型对配对的 RGB 和 LiDAR 数据进行无监督预训练,我们提出了一种能够生成零样本 3D 边界框的点云表示方法,这种方法在半监督检测中能够显著提高检测准确性,尤其适用于 LiDAR-only 和多模态 (RGB + LiDAR) 检测。我们在 nuScenes 和 WOD 上展示了我们方法的有效性,并在有限数据环境中明显改进了之前的工作。
Jun, 2024
本研究综述了使用深度神经网络实现无监督点云表示学习的方法,解决在人工标注数据量有限的问题。研究挖掘了常用数据集和评估指标,提出了基于这些技术的自监督点云表示学习方法的广泛应用,并指出未来可能面临的挑战和潜在问题。
May, 2023
本文介绍了一种利用自监督学习学习无标签 3D 点云的时空表示学习 (STRL) 框架,通过从 3D 数据中获得富含的时空线索来应对 3D 情景理解任务中预训练模型泛化性差的困境,实验证明该方法能显著提高 3D 点云中的表示学习性能。
Sep, 2021