May, 2024

ViewFormer:基于视图引导的 Transformer 模型探索多视角 3D 占位感知的时空建模

TL;DR基于 3D 占据率、多视图特征聚合和动态场景的研究,我们提出了 ViewFormer,一个基于 Transformer 的视觉中心框架,具有高度的可扩展性和优越性能。