Nov, 2023

实现可传递的多模态感知表示学习自主性:NeRF-Supervised 遮蔽自动编码器

TL;DR该论文提出了一种统一的自监督预训练框架,通过在神经辐射场 (NeRF) 中进行掩蔽多模态重建,实现可传输的多模态感知表示学习。实验证明,通过该方法学习到的表示对于多样化的三维感知下游任务(包括三维物体检测和 BEV 地图分割)具有良好的可迁移性,并且可享受掩蔽自编码器和神经辐射场机制的协同效应。