学习精细识别的规范化 3D 物体表示
我们提出了一种可伸缩的无监督面向对象中心的 3D 场景表示学习方法,通过学习在局部对象坐标系统中视角不变的 3D 对象表示,从而推断和维护 3D 场景的对象中心表示,并优于以前的模型。
Sep, 2023
本文提出了一种基于 3D 可变形线框的高分辨率车辆对象表示,该表示能精细地建模单个点和面的水平,结合此表示和明确的 3D 场景模型,我们能够对场景进行更细致和准确的理解并从单个视角评估多个对象的位置与视点的单眼 3D 姿态估计。
Nov, 2014
该研究提出了一种基于 3D 体素特征的中心点检测方法,其中包括一个有效的粗细重建模块,可从单个 2D 图像中检测和重建多个物体的 3D 位置和形状。
Nov, 2021
使用半监督学习的方法,通过将 2D 图像分解成潜在表示组成部分,结合类别、形状、反照率等信息,重建出 3D 的物体结构并生成输入图像的近似图像,有效地利用真实 2D 图像进行模型的拟合。
Apr, 2021
该论文提出了一种新的基于神经纹理的 3D-aware 分类方法,通过使用不同可微渲染技术来估计 3D 目标姿态和分类信息,并得到了比现有单一任务模型更加鲁棒的结果。
May, 2023
通过学习数据中的规范图形表征,我们提出了一种新模型,以改进复杂视觉场景的图像生成,并在 Visual Genome、COCO 和 CLEVR 三个基准测试上展示了模型的改进性能。
Dec, 2019
本文针对 3D 图像生成开展了探索,提出了一种基于多任务卷积神经网络的通用 3D 方案。通过建立代理 3D 任务来提供训练,神经网络在完成核心问题的同时也具备泛化能力和抽象能力,并在多个场景取得了超越 SIFT 等方法的成果。
Oct, 2017
本文介绍了一种针对细分类别的物体姿态估计的新数据集以及一种基于 Faster/Mask R-CNN 模型的姿态估计框架,同时使用了 3D CAD 模型和 location field 来提高性能。
Jun, 2018
论文提出了一种统一框架,用于解决单幅图像特定类别的 3D 重建和新 3D 形状生成的问题。该方法支持弱监督学习,只需要单个实例的 2D 图像,使用网格作为输出表示,并利用光照信息提高了性能。实验结果表明,该方法在定量度量上与最新的基于体素方法相当或优于,而且结果更加美观,并且在弱监督学习方面表现良好。
Jul, 2018
该研究提出了一种新的框架,可以在只有 2D 图像且每个实例只有一个视角的情况下,从单张图像中进行特定类别的三维重建和新形状的生成,并支持较弱的监督。采用网格作为输出表达方式,利用光照参数和明暗信息进行训练,支持对洼地的物体类别进行学习。通过五项应用评估,发现该方法的性能表现优于现有的一些方法。
Jan, 2019