学习中的噪声基准：从 2D 分类到 3D 重建

Jun, 2024

学习中的噪声基准：从 2D 分类到 3D 重建

Learning with Noisy Ground Truth: From 2D Classification to 3D Reconstruction

Yangdi Lu, Wenbo He

TL;DR通过对 LNGT 的分析，我们提出了一种新的分类方法，并进行了有关记忆效应和未来研究机会的探讨，为后续研究提供指导。

Abstract

deep neural networks has been highly successful in data-intense computer vision applications, while such success relies heavily on the massive and clean data. In real-world scenarios, clean data sometimes is difficult to obtain. For example, in image →

deep neural networks noisy ground truth learning with noisy ground truth classification regression

发现论文，激发创造

增强 NeRF-based Pseudo-LiDAR 点云以解决类别不平衡问题

通过生成伪 LiDAR 点云并进行对象级领域对齐和地图信息的上下文感知放置，我们提出了一种名为 PGT-Aug 的方法，用于处理典型的由实际数据采集引起的类别不平衡问题。我们在多个基准数据集上进行了广泛实验证明了我们方法的优越性和通用性，尤其是在由不同 LiDAR 配置捕获的领域差异较大的数据集上。

Mar, 2024

GTR：通过几何和纹理细化改进大型三维重建模型

我们提出了一种新的方法，从多视角图像中进行 3D 网格重建。我们的方法借鉴了像 LRM 这样的大型重建模型，使用了基于 Transformer 的三面体生成器和在多视角图像上进行训练的神经辐射场（NeRF）模型。然而，在我们的方法中，我们引入了一些重要的修改，以显著提高 3D 重建质量。

Jun, 2024

从混沌到清晰：黑暗中的 3DGS

通过自我监督学习的新框架，我们能够在有限的噪声原始图像数量下，从原始图像中重建高动态范围（HDR）3DGS，克服了噪声的影响，提高了重建质量和推断速度。

Jun, 2024

追求基础事实：在注释器噪声存在的情况下学习自信模型并估计不确定性

本文提出了一种与多个标注者的混淆有关的置信模型学习方法，通过对分类器网络添加熵或基于信息的正则化器来鲁棒地估计给定仅含有噪声标签的预测，并在 MNIST、CIFAR-10 和 FMNIST 等数据集上进行了实验，实验结果表明该方法在各项指标上均优于或与其他现有方法表现相当。

Jan, 2023

基于标签引导的辅助训练改进了 3D 物体检测器

本文提出了一种用于改善现有 3D 目标检测器的特征学习的标签指导辅助训练方法，该方法包括两个模块：一个用于将注释和点云映射到特定任务表示的标签注释诱导器和一个协助原始特征获取检测关键表示的标签知识映射器。在室内和室外数据集上的广泛实验验证了该方法的有效性。

Jul, 2022

从 2D GAN 数据中渐进式学习 3D 重建网络

本文介绍了一种使用生成式对抗网络（GAN）生成的多视角图像数据集重建高质量纹理三维模型的方法，其具有可忽略的注释成本，并通过多阶段学习和在线伪标签生成的新颖对抗学习流水线实现了精细的细节并显著改善了之前的方法。

May, 2023

三维点云分类的转导式零样本学习

本文将零样本学习扩展到三维点云分类领域，提出基于三元组损失的方法，并在实验中证明了其在三维点云和二维图像分类任务中的有效性。

Dec, 2019

SAT: 2D 语义辅助的 3D 视觉定位训练

该研究提出了 2D Semantics Assisted Training（SAT）来提高 3D 视觉定位的准确性，通过学习丰富，干净的 2D 对象表示与 3D 场景中的对象或提到的实体之间的对齐关系，辅助 3D 视觉定位，将 2D 语义有效地利用于训练，使方法在 3D 视觉定位数据集上的准确性从 37.7％提高到 49.2％，并且在多个 3D 视觉定位数据集上均优于同类方法。

May, 2021

完全理解通用物体：建模，分割和重建

使用半监督学习的方法，通过将 2D 图像分解成潜在表示组成部分，结合类别、形状、反照率等信息，重建出 3D 的物体结构并生成输入图像的近似图像，有效地利用真实 2D 图像进行模型的拟合。

Apr, 2021

ImageNet3D：面向通用对象级别 3D 理解

通过与 ImageNet 数据集相结合，ImageNet3D 数据集提供了 200 个类别的 2D 和 3D 信息，从而为构建具有更强的通用性目标级三维理解的视觉模型提供了潜力。

Jun, 2024