Mask2CAD:通过学习分割和检索实现 3D 形状预测
该研究提出了一种结合了深度学习和三维几何的方法,利用未带纹理的 CAD 模型和不需要针对新对象进行训练的方法,检测和估计图像中物体的 3D 姿态,并利用 Mask-RCNN 实现无需重新训练的对象检测,从而限制可能的对应关系数量。实验结果表明,该方法与之前的方法相当或更好。
Oct, 2020
本文介绍了一种基于 CAD 模型的方法,通过构建 2D 图像和 3D CAD 模型之间的联合嵌入空间,实现了对物体形状的精确估计和检测。试验结果表明,该方法对于复杂场景中的图像检测更为鲁棒。
Aug, 2021
使用半监督学习的方法,通过将 2D 图像分解成潜在表示组成部分,结合类别、形状、反照率等信息,重建出 3D 的物体结构并生成输入图像的近似图像,有效地利用真实 2D 图像进行模型的拟合。
Apr, 2021
提出了一种半自动的方法来注释复杂多物体场景的视频,该方法使用来自数据库的 CAD 模型对每个物体进行注释,并使用 9-DoF 姿态变换将其放置在场景的 3D 坐标系中,从而构建了一个大规模的数据集 CAD-Estate,并用它进行了 Mask2CAD 预训练。
Jun, 2023
本文介绍了一种用于三维目标姿态估计的新方法,将 RGB 图像与 CAD 模型匹配以实现目标姿态估计,通过学习选择关键点并保持视角和模态不变性的目标,消除了对昂贵的三维姿态注释的需求,并通过大量实验证明了该方法能够可靠地估计 RGB 图像中的目标姿态以及推广到训练期间未看到的目标实例。
Nov, 2018
基于 CAD 模型基元从 RGB 图像中感知 3D 结构可以有效地实现基于三维物体的场景表示,本文提出了 DiffCAD,这是一种第一个弱监督的条件生成方法,可以从 RGB 图像中检索和对齐 CAD 模型,通过扩散学习隐式概率模型来捕捉 CAD 对象在图像中的形状、姿态和尺度,实现了多个假设生成和对深度 / 尺度和形状匹配的歧义进行建模。
Nov, 2023
通过使用 FastCAD 方法,可以实时地检索和对齐给定场景中的所有对象的 CAD 模型,同时预测对齐参数和形状嵌入,加快了推理时间并提高了 3D 重建和对齐的准确性。
Mar, 2024
通过增加合成训练数据,使得含有 3D CAD 模型的深度卷积神经网络(DCNN)训练数据可以更好地适应目标领域,本文详细分析了在没有低级线索(纹理,姿态和背景)的情况下 DCNN 的学习能力,并表明我们的合成 DCNN 训练方法在几乎没有真实数据的情况下可以在 PASCAL VOC2007 数据集上获得更好的性能,并且可以在 Office 基准测试中的域偏移场景中提高性能。
Dec, 2014
我们提出了一种自动化和高效的方法,用于检索通过移动 RGB-D 相机捕获的场景中物体的高质量 CAD 模型及其姿势,并使用渲染对比和蒙特卡洛树搜索算法实现了物体检索、CAD 模型和姿势估计的快速搜索。
Sep, 2023