学习中的噪声基准:从 2D 分类到 3D 重建
通过生成伪 LiDAR 点云并进行对象级领域对齐和地图信息的上下文感知放置,我们提出了一种名为 PGT-Aug 的方法,用于处理典型的由实际数据采集引起的类别不平衡问题。我们在多个基准数据集上进行了广泛实验证明了我们方法的优越性和通用性,尤其是在由不同 LiDAR 配置捕获的领域差异较大的数据集上。
Mar, 2024
我们提出了一种新的方法,从多视角图像中进行 3D 网格重建。我们的方法借鉴了像 LRM 这样的大型重建模型,使用了基于 Transformer 的三面体生成器和在多视角图像上进行训练的神经辐射场(NeRF)模型。然而,在我们的方法中,我们引入了一些重要的修改,以显著提高 3D 重建质量。
Jun, 2024
通过自我监督学习的新框架,我们能够在有限的噪声原始图像数量下,从原始图像中重建高动态范围(HDR)3DGS,克服了噪声的影响,提高了重建质量和推断速度。
Jun, 2024
本文提出了一种与多个标注者的混淆有关的置信模型学习方法,通过对分类器网络添加熵或基于信息的正则化器来鲁棒地估计给定仅含有噪声标签的预测,并在 MNIST、CIFAR-10 和 FMNIST 等数据集上进行了实验,实验结果表明该方法在各项指标上均优于或与其他现有方法表现相当。
Jan, 2023
本文提出了一种用于改善现有 3D 目标检测器的特征学习的标签指导辅助训练方法,该方法包括两个模块:一个用于将注释和点云映射到特定任务表示的标签注释诱导器和一个协助原始特征获取检测关键表示的标签知识映射器。在室内和室外数据集上的广泛实验验证了该方法的有效性。
Jul, 2022
本文介绍了一种使用生成式对抗网络(GAN)生成的多视角图像数据集重建高质量纹理三维模型的方法,其具有可忽略的注释成本,并通过多阶段学习和在线伪标签生成的新颖对抗学习流水线实现了精细的细节并显著改善了之前的方法。
May, 2023
该研究提出了 2D Semantics Assisted Training(SAT)来提高 3D 视觉定位的准确性,通过学习丰富,干净的 2D 对象表示与 3D 场景中的对象或提到的实体之间的对齐关系,辅助 3D 视觉定位,将 2D 语义有效地利用于训练,使方法在 3D 视觉定位数据集上的准确性从 37.7%提高到 49.2%,并且在多个 3D 视觉定位数据集上均优于同类方法。
May, 2021
使用半监督学习的方法,通过将 2D 图像分解成潜在表示组成部分,结合类别、形状、反照率等信息,重建出 3D 的物体结构并生成输入图像的近似图像,有效地利用真实 2D 图像进行模型的拟合。
Apr, 2021
通过与 ImageNet 数据集相结合,ImageNet3D 数据集提供了 200 个类别的 2D 和 3D 信息,从而为构建具有更强的通用性目标级三维理解的视觉模型提供了潜力。
Jun, 2024