ICCVSep, 2019

多视点 PointNet 用于 3D 场景理解

TL;DR本文介绍了 MVPNet 模型,该模型使用视图选择和 2D-3D 特征聚合模块将 2D 多视图图像特征汇集到 3D 点云中,并使用基于点的网络将 3D 规范空间中的特征融合以预测 3D 语义标签。该方法在 3D 语义分割任务上,优于以前的点云方法,并且训练速度比稀疏体素方法的大型网络快得多。