Dec, 2022

通过图像到点蒙版自编码器从二维预训练模型中学习三维表示

TL;DR利用自监督的预训练,我们通过Image-to-Point Masked Autoencoders(I2P-MAE)从2D预训练模型中获取优秀的3D表示,其中我们引入了两种图像到点的学习方案:一种是引入2D引导遮罩策略,另一种是通过可见的点重构相应的多视角2D特征;与现有方法的完全训练结果相当的冻结I2P-MAE在ModelNet40上实现了93.4%的线性SVM准确性,在进一步在ScanObjectNN的最困难的分割上进行微调后,I2P-MAE达到了90.11%的最新技术水平,比第二好的方法高3.68%,展示出优秀的可转移能力。