学习精细识别的规范化 3D 物体表示

ICCVAug, 2021

学习精细识别的规范化 3D 物体表示

Learning Canonical 3D Object Representation for Fine-Grained Recognition

Sunghun Joung, Seungryong Kim, Minsu Kim, Ig-Jae Kim, Kwanghoon Sohn

TL;DR该研究提出了一种新型的精细物体识别框架，能够从一个单一的图像中学习恢复物体在三维空间中的变化，并在无需使用任何基准 3D 注释情况下，在图像集合上进行训练。

Abstract

We propose a novel framework for fine-grained object recognition that learns to recover object variation in 3d space from a single image, trained on an →

fine-grained object recognition 3d space image collection 3d annotation shape variation

发现论文，激发创造

可扩展的三维对象为中心学习的变异推断

我们提出了一种可伸缩的无监督面向对象中心的 3D 场景表示学习方法，通过学习在局部对象坐标系统中视角不变的 3D 对象表示，从而推断和维护 3D 场景的对象中心表示，并优于以前的模型。

Sep, 2023

通过详细的 3D 物体表征实现场景理解

本文提出了一种基于 3D 可变形线框的高分辨率车辆对象表示，该表示能精细地建模单个点和面的水平，结合此表示和明确的 3D 场景模型，我们能够对场景进行更细致和准确的理解并从单个视角评估多个对象的位置与视点的单眼 3D 姿态估计。

Nov, 2014

基于体素的单图像多物体三维检测和重建

该研究提出了一种基于 3D 体素特征的中心点检测方法，其中包括一个有效的粗细重建模块，可从单个 2D 图像中检测和重建多个物体的 3D 位置和形状。

Nov, 2021

完全理解通用物体：建模，分割和重建

使用半监督学习的方法，通过将 2D 图像分解成潜在表示组成部分，结合类别、形状、反照率等信息，重建出 3D 的物体结构并生成输入图像的近似图像，有效地利用真实 2D 图像进行模型的拟合。

Apr, 2021

通过区分性渲染和比较实现强大的三维感知物体分类

该论文提出了一种新的基于神经纹理的 3D-aware 分类方法，通过使用不同可微渲染技术来估计 3D 目标姿态和分类信息，并得到了比现有单一任务模型更加鲁棒的结果。

May, 2023

场景图像生成中规范表示的学习

通过学习数据中的规范图形表征，我们提出了一种新模型，以改进复杂视觉场景的图像生成，并在 Visual Genome、COCO 和 CLEVR 三个基准测试上展示了模型的改进性能。

Dec, 2019

通过姿态估计和匹配实现通用三维表示

本文针对 3D 图像生成开展了探索，提出了一种基于多任务卷积神经网络的通用 3D 方案。通过建立代理 3D 任务来提供训练，神经网络在完成核心问题的同时也具备泛化能力和抽象能力，并在多个场景取得了超越 SIFT 等方法的成果。

Oct, 2017

细粒度物体类别的三维姿态估计

本文介绍了一种针对细分类别的物体姿态估计的新数据集以及一种基于 Faster/Mask R-CNN 模型的姿态估计框架，同时使用了 3D CAD 模型和 location field 来提高性能。

Jun, 2018

仅仅利用二维监督学习来生成和重建三维网格

论文提出了一种统一框架，用于解决单幅图像特定类别的 3D 重建和新 3D 形状生成的问题。该方法支持弱监督学习，只需要单个实例的 2D 图像，使用网格作为输出表示，并利用光照信息提高了性能。实验结果表明，该方法在定量度量上与最新的基于体素方法相当或优于，而且结果更加美观，并且在弱监督学习方面表现良好。

Jul, 2018

通过形状、姿态和着色的生成建模学习单张图片的三维重建

该研究提出了一种新的框架，可以在只有 2D 图像且每个实例只有一个视角的情况下，从单张图像中进行特定类别的三维重建和新形状的生成，并支持较弱的监督。采用网格作为输出表达方式，利用光照参数和明暗信息进行训练，支持对洼地的物体类别进行学习。通过五项应用评估，发现该方法的性能表现优于现有的一些方法。

Jan, 2019