CAD-Estate: RGB 视频中的大规模 CAD 模型标注

Jun, 2023

CAD-Estate: RGB 视频中的大规模 CAD 模型标注

CAD-Estate: Large-scale CAD Model Annotation in RGB Videos

Kevis-Kokitsi Maninis, Stefan Popov, Matthias Nießner, Vittorio Ferrari

TL;DR提出了一种半自动的方法来注释复杂多物体场景的视频，该方法使用来自数据库的 CAD 模型对每个物体进行注释，并使用 9-DoF 姿态变换将其放置在场景的 3D 坐标系中，从而构建了一个大规模的数据集 CAD-Estate，并用它进行了 Mask2CAD 预训练。

Abstract

We propose a method for annotating videos of complex multi-object scenes with a globally-consistent 3D representation of the objects. We annotate each object with a cad model from a database, and place it in the 3D coordinate frame of the scene with a 9-DoF pose transformation. Our met

3d object annotation cad model semi-automatic method large-scale dataset mask2cad pre-training

发现论文，激发创造

Mask2CAD：通过学习分割和检索实现 3D 形状预测

本文提出了一种基于 CAD 模型的方法，结合现有的大规模三维模型数据集，构建了一种可以检测现实世界图像中物体的 CAD 模型表示方法，并且证明了与现有技术相比，该方法在真实世界图像中有着优势。

Jul, 2020

学习本地 RGB-CAD 对应关系用于物体姿态估计

本文介绍了一种用于三维目标姿态估计的新方法，将 RGB 图像与 CAD 模型匹配以实现目标姿态估计，通过学习选择关键点并保持视角和模态不变性的目标，消除了对昂贵的三维姿态注释的需求，并通过大量实验证明了该方法能够可靠地估计 RGB 图像中的目标姿态以及推广到训练期间未看到的目标实例。

Nov, 2018

FastCAD：来自扫描和视频的实时 CAD 检索和对齐

通过使用 FastCAD 方法，可以实时地检索和对齐给定场景中的所有对象的 CAD 模型，同时预测对齐参数和形状嵌入，加快了推理时间并提高了 3D 重建和对齐的准确性。

Mar, 2024

HOC-Search: 基于 RGB-D 扫描的高效 CAD 模型和姿态检索

我们提出了一种自动化和高效的方法，用于检索通过移动 RGB-D 相机捕获的场景中物体的高质量 CAD 模型及其姿势，并使用渲染对比和蒙特卡洛树搜索算法实现了物体检索、CAD 模型和姿势估计的快速搜索。

Sep, 2023

Vid2CAD: 使用视频的多视角约束进行 CAD 模型对齐

该研究在处理 CAD 模型和多个物体出现在视频场景中的对齐问题中，提出一种基于神经网络和多视角约束的方法，自动恢复每个物体的九自由度姿态参数，提高物体的位姿参数估计精度，重建单个 CAD 表征的场景，与现有单帧方法进行比对，在 Scan2CAD 数据集上提高了 11.6％至 30.7％的类别平均准确性。

Dec, 2020

利用本地表面嵌入技术在彩色图像中实现未知物体的三维目标检测和姿态估计

该研究提出了一种结合了深度学习和三维几何的方法，利用未带纹理的 CAD 模型和不需要针对新对象进行训练的方法，检测和估计图像中物体的 3D 姿态，并利用 Mask-RCNN 实现无需重新训练的对象检测，从而限制可能的对应关系数量。实验结果表明，该方法与之前的方法相当或更好。

Oct, 2020

Scan2CAD：RGB-D 扫描中的 CAD 模型对齐学习

Scan2CAD 是一种数据驱动的方法，可以学习将形状数据库中的 3D CAD 模型对齐到商品 RGB-D 扫描的噪声和不完整几何形状中，其可用于室内场景的三维重建。该方法使用三维卷积神经网络来预测 CAD 模型与其对应扫描对象之间的对应关系，并通过变分能量最小化将 CAD 模型与重构对齐，其在 Scan2CAD 基准测试中表现优异。

Nov, 2018

ScanNet: 室内场景丰富注释的 3D 重建

本文介绍了 ScanNet 数据集的构建，该数据集包含 2.5M 的视图和 1513 个场景，提供了 3D 摄像机姿势、表面重构和语义分割等信息，并表明使用此数据集可以在 3D 场景理解任务中实现最先进的性能。

Feb, 2017

准确灵活的实例重建的 CAD 先验

提出一种自动高效的 3D 目标重建方法，利用先验 CAD 模型，通过本文贡献的局部隐式形状模型（LISM）的对象检测方法，可从小型或大型（125m³）物体上高精度重建。

May, 2017

基于合成数据的鲁棒性类别层次 3D 姿态估计

本篇论文提出 SyntheticP3D 数据集和 CC3D 方法，结合这两种方法可以实现在只用 10% 的真实数据的情况下，与当前最先进的模型在物体位姿估计方面取得了可与之媲美结果，在采用 50% 的真实数据时还超越了 SOTA 模型 10.4%。

May, 2023