Mask2CAD：通过学习分割和检索实现 3D 形状预测

ECCVJul, 2020

Mask2CAD：通过学习分割和检索实现 3D 形状预测

Mask2CAD: 3D Shape Prediction by Learning to Segment and Retrieve

Weicheng Kuo, Anelia Angelova, Tsung-Yi Lin, Angela Dai

TL;DR本文提出了一种基于 CAD 模型的方法，结合现有的大规模三维模型数据集，构建了一种可以检测现实世界图像中物体的 CAD 模型表示方法，并且证明了与现有技术相比，该方法在真实世界图像中有着优势。

Abstract

object recognition has seen significant progress in the image domain, with focus primarily on 2D perception. We propose to leverage existing large-scale datasets of 3D models to understand the underlying 3D structure of objects seen in an image by constructing a →

object recognition 3d modeling cad-based representation image-to-3d real-world images

发现论文，激发创造

利用本地表面嵌入技术在彩色图像中实现未知物体的三维目标检测和姿态估计

该研究提出了一种结合了深度学习和三维几何的方法，利用未带纹理的 CAD 模型和不需要针对新对象进行训练的方法，检测和估计图像中物体的 3D 姿态，并利用 Mask-RCNN 实现无需重新训练的对象检测，从而限制可能的对应关系数量。实验结果表明，该方法与之前的方法相当或更好。

Oct, 2020

Patch2CAD：单张图像中自然环境下的形状检索的补丁嵌入学习

本文介绍了一种基于 CAD 模型的方法，通过构建 2D 图像和 3D CAD 模型之间的联合嵌入空间，实现了对物体形状的精确估计和检测。试验结果表明，该方法对于复杂场景中的图像检测更为鲁棒。

Aug, 2021

完全理解通用物体：建模，分割和重建

使用半监督学习的方法，通过将 2D 图像分解成潜在表示组成部分，结合类别、形状、反照率等信息，重建出 3D 的物体结构并生成输入图像的近似图像，有效地利用真实 2D 图像进行模型的拟合。

Apr, 2021

稀疏多物体渲染与比较

通过引入多目标检测网络，本研究在 CAD 模型、3D 形状、姿势估计领域取得了最先进的表现，提高了实例对齐准确度，与多视角方法相当。

Oct, 2023

CAD-Estate: RGB 视频中的大规模 CAD 模型标注

提出了一种半自动的方法来注释复杂多物体场景的视频，该方法使用来自数据库的 CAD 模型对每个物体进行注释，并使用 9-DoF 姿态变换将其放置在场景的 3D 坐标系中，从而构建了一个大规模的数据集 CAD-Estate，并用它进行了 Mask2CAD 预训练。

Jun, 2023

学习本地 RGB-CAD 对应关系用于物体姿态估计

本文介绍了一种用于三维目标姿态估计的新方法，将 RGB 图像与 CAD 模型匹配以实现目标姿态估计，通过学习选择关键点并保持视角和模态不变性的目标，消除了对昂贵的三维姿态注释的需求，并通过大量实验证明了该方法能够可靠地估计 RGB 图像中的目标姿态以及推广到训练期间未看到的目标实例。

Nov, 2018

DiffCAD: 基于弱监督的概率 CAD 模型检索和对齐

基于 CAD 模型基元从 RGB 图像中感知 3D 结构可以有效地实现基于三维物体的场景表示，本文提出了 DiffCAD，这是一种第一个弱监督的条件生成方法，可以从 RGB 图像中检索和对齐 CAD 模型，通过扩散学习隐式概率模型来捕捉 CAD 对象在图像中的形状、姿态和尺度，实现了多个假设生成和对深度 / 尺度和形状匹配的歧义进行建模。

Nov, 2023

FastCAD：来自扫描和视频的实时 CAD 检索和对齐

通过使用 FastCAD 方法，可以实时地检索和对齐给定场景中的所有对象的 CAD 模型，同时预测对齐参数和形状嵌入，加快了推理时间并提高了 3D 重建和对齐的准确性。

Mar, 2024

从 3D 模型学习深度物体检测器

通过增加合成训练数据，使得含有 3D CAD 模型的深度卷积神经网络（DCNN）训练数据可以更好地适应目标领域，本文详细分析了在没有低级线索（纹理，姿态和背景）的情况下 DCNN 的学习能力，并表明我们的合成 DCNN 训练方法在几乎没有真实数据的情况下可以在 PASCAL VOC2007 数据集上获得更好的性能，并且可以在 Office 基准测试中的域偏移场景中提高性能。

Dec, 2014

HOC-Search: 基于 RGB-D 扫描的高效 CAD 模型和姿态检索

我们提出了一种自动化和高效的方法，用于检索通过移动 RGB-D 相机捕获的场景中物体的高质量 CAD 模型及其姿势，并使用渲染对比和蒙特卡洛树搜索算法实现了物体检索、CAD 模型和姿势估计的快速搜索。

Sep, 2023