Jun, 2024

3D-MVP:用于机器人操纵的三维多视角预训练

TL;DR提出了 3D-MVP,一种使用遮罩自编码器进行 3D 多视图预训练的新方法,通过在大规模 3D 数据集上使用遮罩自编码器对其视觉编码器进行预训练,评估了其在虚拟机器人操作任务中的性能并展示了超过基线的改进,同时在实际机器人平台上也取得了令人期待的结果。