CVPRMar, 2022

CodedVTR:基于码本的稀疏体素变换器以及几何引导

TL;DR提出基于码本的体素 Transformer(CodedVTR)以提高 3D 稀疏体素 Transformer 的数据效率和泛化能力,其中包括通过学习可学习码本中的原型来规范化注意力学习和改善泛化能力,并利用几何信息(几何模式、密度)指导注意力学习。CodedVTR 可嵌入现有的基于稀疏卷积的方法,并为室内和室外 3D 语义分割任务带来一致的性能提升。