提升数据高效三维场景理解的表示学习的泛化能力

Jun, 2024

提升数据高效三维场景理解的表示学习的泛化能力

Enhancing Generalizability of Representation Learning for Data-Efficient 3D Scene Understanding

Yunsong Wang, Na Zhao, Gim Hee Lee

TL;DR通过利用生成贝叶斯网络产生具有真实世界模式的多样化合成场景，并通过联合学习粗到精的对比学习任务和遮挡感知重建任务，我们提出了可泛化的表示学习（GRL）方法，从而为三维场景的理解提供了可传递、几何信息化的表示。在合成数据的预训练之后，我们的模型的所掌握的知识可以通过真实世界基准数据集实现无缝传递到与三维场景理解相关的两个主要下游任务，即三维物体检测和三维语义分割，并通过详尽系列的实验证明了我们方法相对于现有最新预训练方法的持续优势。

Abstract

The field of self-supervised 3d representation learning has emerged as a promising solution to alleviate the challenge presented by the scarcity of extensive, well-annotated datasets. However, it continues to be hindered by the lack of diverse, large-scale, real-world 3D scene datasets

self-supervised 3d representation learning generalizable representation learning (grl)generative bayesian network coarse-to-fine contrastive learning occlusion-aware reconstruction

发现论文，激发创造

SGRec3D: 自主学习的 3D 场景图通过对象级场景重建

提出了 SGRec3D，这是一种用于预先训练三维场景图预测的新方法，无需对象关系标签，可以利用大规模三维场景理解数据集进行训练。在细调期间只使用 10% 标记数据集便可优于未进行预先训练的模型。

Sep, 2023

通用自监督预训练的三维随机场景生成

为了解决实际场景 3D 数据获取困难的问题，本文通过研究不同的数据生成方法并使用统一的评估体系，评估了不同预训练模型在多个任务中的表现，比如物体检测和语义分割，并提出了一种新的基于球谐函数的 3D 场景生成方法，在性能上超越了以往的方法，并且与使用真实世界扫描和 CAD 模型的方法表现不相上下。

Jun, 2023

3D 点云时空自监督表示学习

本文介绍了一种利用自监督学习学习无标签 3D 点云的时空表示学习 (STRL) 框架，通过从 3D 数据中获得富含的时空线索来应对 3D 情景理解任务中预训练模型泛化性差的困境，实验证明该方法能显著提高 3D 点云中的表示学习性能。

Sep, 2021

基于混合表示的场景合成深度生成建模

本论文提出了一种基于深度生成模型的室内环境场景建模技术，使用前馈神经网络将先验分布映射到室内场景中的主要物体分布，并结合 2D 和 3D 物体排列表示的区分器损失对该模型进行训练，并在多个基准数据集上验证了该模型在场景插值和补全方面的有效性。

Aug, 2018

使用三维先验增强二维表示学习

通过在训练过程中直接强制将强大的三维结构先验性知识融入模型，我们提出了一种新的方法来加强现有的自监督学习方法，并通过一系列数据集实验证明了我们的三维感知表示比传统的自监督基线更加稳健。

Jun, 2024

通过层次特征对齐预训练和区域感知微调的通用标签高效三维场景解析

通过使用预先训练的视觉 - 语言模型和无监督的区域级语义对比学习方案，本研究提出了一种通用且简单的框架，用于处理有限标记情况下的 3D 场景理解，从而在数据效率学习和开放世界少样本学习方面展现了有效性。

Dec, 2023

场景表示网络：连续的三维结构感知神经场景表示

提出了一种连续三维结构感知场景表征模型 Scene Representation Networks (SRNs)，能够通过不需要深度或形状信息的二维图像及其相机姿态进行端到端训练，并在视角合成、少样本重建、形状外插及表现插值等任务中展示出潜力。

Jun, 2019

可扩展的三维对象为中心学习的变异推断

我们提出了一种可伸缩的无监督面向对象中心的 3D 场景表示学习方法，通过学习在局部对象坐标系统中视角不变的 3D 对象表示，从而推断和维护 3D 场景的对象中心表示，并优于以前的模型。

Sep, 2023

联合监督与自监督学习 3D 现实世界挑战

本文介绍了基于自监督式多任务模型的方法，用于解决数据稀缺性和跨域数据集问题，提高 3D 形状分类与部分分割的效果。

Apr, 2020

具有通用高斯喷洒的强化学习

通过在 RoboMimic 环境中验证，本研究提出一个名为 GSRL 的创新广义高斯喷洒框架作为强化学习任务的表征，相比基线方法在多个任务上提高了 10％，44％和 15％的性能，是首次尝试将可泛化的 3DGS 作为强化学习的表征。

Mar, 2024