室内场景的完整三维模型预测
本文系统地总结介绍了低成本稳定的 2.5/3D 视觉感知器件在计算机视觉领域中如何应用于室内环境中的视觉场景理解,包括数据表示,核心技术,场景理解任务,性能评价以及面临的挑战。
Mar, 2018
本文提出了使用隐式函数进行场景级别三维重建的方法,利用 RGBD 数据对三维重建进行预测,与使用网络相比具有更好的鲁棒性和更少的标注要求。
Jun, 2023
本文提出一种新的方法,通过联合优化 CAD 模型对齐以及场景布局的估计,显式建模物体间及物体与布局之间的相互关系,通过引入 Hierarchical layout prediction 方法和 message-passing graph neural network 模型,实现了全局一致的场景 CAD-based 表示,实验结果表明相比现有算法准确率显著提高,对于增强现实或虚拟现实等内容创建等应用具有广泛的适用性。
Mar, 2020
本文提出了一种基于 3D 可变形线框的高分辨率车辆对象表示,该表示能精细地建模单个点和面的水平,结合此表示和明确的 3D 场景模型,我们能够对场景进行更细致和准确的理解并从单个视角评估多个对象的位置与视点的单眼 3D 姿态估计。
Nov, 2014
研究如何从 1 或多张图像中合成逼真的室内 3D 场景,采用了基于图像的 GAN 来直接映射成高分辨率的 RGB-D 图像,及在 VLN 训练中进行空间干扰以提高成功率。
Apr, 2022
该研究旨在使用卷积神经网络检测和定位 RGB-D 场景中的物体,然后使用 3D 模型替换它们,相对于目前最先进的算法,该方法在 3D 检测任务中表现出 48%的相对改进,并且速度更快。
Feb, 2015
本文提出从机器人体验和交互的角度重新思考场景重建问题,通过 RGB-D 数据流实现一个交互场景的重建,该场景通过一个基于图的场景表示组织物体之间的物理常识来推理物体的可行性和上下文关系,并将物体网格替换为基于零件的关节 CAD 模型,以提供更细致的机器人交互。
Mar, 2021
研究了一个新的问题,即从复杂的室外道路场景的透视视图中估计遮挡推理的语义场景布局,提出了一种卷积神经网络方法,根据前景物体(如汽车或行人)周围的信息来预测场景布局的遮挡部分,直接预测遮挡区域的深度和语义能更好地转换成俯视图,模型的训练不需要昂贵或主观的人工标注。
Mar, 2018
本研究提出了一种基于多视图图像的方法,用于识别三维场景的对象形状和布局,通过在大型数据集上的实验,证明该方法可扩展应用于现实图像,并与依赖三维信息的方法相比,表现得更好。
Jun, 2022
通过对场景信息和先前知识进行建模,我们提出了一种新的方法来从 RGB-D 图像中重建带有遮挡的 3D 人体,通过建模可能的姿势空间并使用深度数据约束可见身体部分,我们的方法在 PROX 数据集上的实验结果表明,与其他方法相比,能够产生更准确和合理的结果。
Oct, 2023