Existing solutions for 3d semantic occupancy prediction typically treat the
task as a one-shot 3D voxel-wise segmentation perception problem. These
discriminative methods focus on learning the mapping between the inputs and
occupancy map in a single step, lacking the ability to gradual
OctreeOcc 是一种创新的 3D 占用预测框架,通过利用八叉树表示来自适应地捕捉 3D 中的有价值信息,以适应不同尺寸和复杂度的对象形状和语义区域。通过改善初始八叉树结构的准确性和设计有效的矫正机制来优化八叉树结构。在广泛的评估中,OctreeOcc 不仅在占用预测方面超越了最先进的方法,而且与基于密集网格的方法相比,还减少了 15%-24% 的计算开销。
本文介绍了一种名为 PanoOcc 的方法,它是一个基于相机的 3D 全景分割方法,它使用体素查询来聚合来自多帧和多视角图像的时空信息,并将特征学习和场景表示集成到一种全面的占用表示中,用于摄像机 3D 场景理解的统一占用表示,从而实现了更好的摄像机语义分割和全景分割结果,并且该方法可以很容易地扩展到密集的占用预测。
基于多传感器融合的 3D 占用预测方法 OccFusion,使用无需深度估计的多模态融合以及相应的点云采样算法,通过主动训练方法和主动粗到细流程,提高了复杂场景中预测的准确性和鲁棒性,有效优化了计算资源需求。在开放占用评测中,该方法超过了现有基于多模态的最先进方法,并且训练和推理阶段更加高效。细致的消融研究证明了我们提出的技术的有效性。