室内场景的完整三维模型预测

Apr, 2015

Predicting Complete 3D Models of Indoor Scenes

Ruiqi Guo, Chuhang Zou, Derek Hoiem

TL;DR本文提出了一种基于数据驱动的方法解释室内场景，并利用 CAD 3D 模型表示场景中的物体和墙壁布局，最终在 NYU 数据集上呈现了令人鼓舞的结果。

Abstract

One major goal of vision is to infer physical models of objects, surfaces, and their layout from sensors. In this paper, we aim to interpret indoor scenes from one RGBD image. Our representation encodes the layout of walls, which must conform to a Manhattan structure but is otherwise f

indoor scenes 3d parse object regions data-driven approach nyu v2 dataset

发现论文，激发创造

自主智能体的 2.5/3D 室内场景理解：一份综述

本文系统地总结介绍了低成本稳定的 2.5/3D 视觉感知器件在计算机视觉领域中如何应用于室内环境中的视觉场景理解，包括数据表示，核心技术，场景理解任务，性能评价以及面临的挑战。

Mar, 2018

从姿势 RGBD 数据学习预测场景级隐式 3D

本文提出了使用隐式函数进行场景级别三维重建的方法，利用 RGBD 数据对三维重建进行预测，与使用网络相比具有更好的鲁棒性和更少的标注要求。

Jun, 2023

SceneCAD：基于 RGB-D 扫描的物体对齐和布局预测

本文提出一种新的方法，通过联合优化 CAD 模型对齐以及场景布局的估计，显式建模物体间及物体与布局之间的相互关系，通过引入 Hierarchical layout prediction 方法和 message-passing graph neural network 模型，实现了全局一致的场景 CAD-based 表示，实验结果表明相比现有算法准确率显著提高，对于增强现实或虚拟现实等内容创建等应用具有广泛的适用性。

Mar, 2020

通过详细的 3D 物体表征实现场景理解

本文提出了一种基于 3D 可变形线框的高分辨率车辆对象表示，该表示能精细地建模单个点和面的水平，结合此表示和明确的 3D 场景模型，我们能够对场景进行更细致和准确的理解并从单个视角评估多个对象的位置与视点的单眼 3D 姿态估计。

Nov, 2014

室内三维场景的简单有效合成

研究如何从 1 或多张图像中合成逼真的室内 3D 场景，采用了基于图像的 GAN 来直接映射成高分辨率的 RGB-D 图像，及在 VLN 训练中进行空间干扰以提高成功率。

Apr, 2022

从 RGB-D 图像推断三维物体姿态

该研究旨在使用卷积神经网络检测和定位 RGB-D 场景中的物体，然后使用 3D 模型替换它们，相对于目前最先进的算法，该方法在 3D 检测任务中表现出 48％的相对改进，并且速度更快。

Feb, 2015

通过全景映射和 CAD 模型对齐重建交互式 3D 场景

本文提出从机器人体验和交互的角度重新思考场景重建问题，通过 RGB-D 数据流实现一个交互场景的重建，该场景通过一个基于图的场景表示组织物体之间的物理常识来推理物体的可行性和上下文关系，并将物体网格替换为基于零件的关节 CAD 模型，以提供更细致的机器人交互。

Mar, 2021

学习环视物体，以生成室外场景的俯视图表征

研究了一个新的问题，即从复杂的室外道路场景的透视视图中估计遮挡推理的语义场景布局，提出了一种卷积神经网络方法，根据前景物体（如汽车或行人）周围的信息来预测场景布局的遮挡部分，直接预测遮挡区域的深度和语义能更好地转换成俯视图，模型的训练不需要昂贵或主观的人工标注。

Mar, 2018

学习三维物体的形状和布局，无需三维监督

本研究提出了一种基于多视图图像的方法，用于识别三维场景的对象形状和布局，通过在大型数据集上的实验，证明该方法可扩展应用于现实图像，并与依赖三维信息的方法相比，表现得更好。

Jun, 2022

从 RGB-D 数据中重构带有遮挡的 3D 人体姿势

通过对场景信息和先前知识进行建模，我们提出了一种新的方法来从 RGB-D 图像中重建带有遮挡的 3D 人体，通过建模可能的姿势空间并使用深度数据约束可见身体部分，我们的方法在 PROX 数据集上的实验结果表明，与其他方法相比，能够产生更准确和合理的结果。

Oct, 2023