平面感知网络室内三维重建
本论文提出了一种名为 Im2Pano3D 的卷积神经网络,该网络可以仅基于部分观察(<=50%),即 RGB-D 图像,为室内全景视图生成 3D 结构的稠密预测和语义标签的概率分布,其利用大规模合成和实际环境内部场景中学习到的强大的语境先验来实现。
Dec, 2017
介绍了一种用于 360 度图像的单目表面法线估计架构 PanoNormal,通过使用多级全局自注意机制和考虑球面特征分布,结合了 CNN 和 ViTs 的优势,实现了在多个流行的 360 度单目数据集上的最先进性能。
May, 2024
本研究提出了一种新型的动态平面卷积占据网络 (Dynamic Plane Convolutional Occupancy Networks),它可以通过编码点云并将其投影到多个 2D 动态平面上,使用全连接网络来预测最佳的平面参数,进而从未定向的点云中实现更优秀的表面重建。该方法在 ShapeNet 和室内场景数据集上均表现出优越性能,并对学习到的动态平面的分布提供了有趣的观察结果。
Nov, 2020
本文提出了一种基于水平面和垂直面的 360 度室内全景图像近似场景的方法,并使用具有地面真实数据的数据集进行了测试,结果表明本文的方法在室内全景图像处理中具有更好的性能。
Jun, 2021
该论文提出了一种从单个全景图像中恢复室内场景的三维布局恢复新方法,该方法结合几何推理和深度学习技术,从而提取结构角并生成房间的布局模型,并在 SUN360 和 Stanford 公共数据集上进行实验。
Jun, 2018
本研究通过采用室内场景中表现出来的结构规律,采用两个额外的自我监督信号进行自我监督培训:1) 曼哈顿法线约束,2) 共面约束,来训练更好的深度网络。
Aug, 2021
我们提出了一种新型的 FCN,能够与全向图像一起工作,输出精确的概率地图,表示室内场景的主要结构,能够适用于不同的数据。我们的方法处理遮挡,并且更准确地恢复了房间实际形状。我们不仅在 3D 模型精度方面优于现有技术,而且在速度方面也优于现有技术。
Aug, 2018
本文提出了一种卷积网络,可以仅仅基于单张图像预测出物体的 RGB 图和深度图,并将多幅深度图融合成完整点云后可转换成表面网格来对任意视野下的三维物体进行识别。网络通过合成的三维车和椅子模型进行训练,在有杂乱背景并搭配真实车辆图像的情况下,仍可生成合理的推测。
Nov, 2015
GroundNet 模型通过多任务联合优化像素级表面法线方向、地面平面分割和深度估计,实现从单张图像中估算出地面平面的 3D 方向,通过加入一致性损失优化了地面平面法线预测,并在 ApolloScape 和 KITTI 等真实世界数据集上取得了顶尖水平。
Nov, 2018