Sep, 2022

从2D视觉Transformer开始解决3D视觉任务?

TL;DR本文提出一种通用的视觉转换器(Visual Transformer),名为Simple3D-Former,可用于高效地进行2D和3D任务的训练和预测,并且相比高度定制的3D特有设计实现了惊人的鲁棒性,同时利用大规模现实2D图像的预训练权重可免费提高3D任务的性能.