Apr, 2023

Swin3D: 用于 3D 室内场景理解的预训练 Transformer 骨干网络

TL;DR本研究提出了一种基于 3D Swin transformer 的预训练 3D backbone——Swin3D,并结合大型结构化数据集 Structured3D 进行了预训练。研究发现,在 3D 室内场景理解方面,Swin3D 先于所有现有技术,并表现出较好的普适性和优越性能,预训练 3D backbone 能够对 3D 识别任务产生巨大作用。