Feb, 2023

VoxFormer:基于摄像机的稀疏体素变换器用于三维语义场景完成

TL;DR本论文提出了一种基于 Transformer 的场景语义补全框架 VoxFormer,可以从 2D 图像中输出完整的 3D 体素语义,并在测试中获得了相对 20% 的几何和 18.1% 的语义方面的提升。