BriefGPT.xyz
Ask
alpha
关键词
mim4d
搜索结果 - 1
MIM4D:多视角视频遮蔽建模的自动驾驶表示学习
从大规模多视角视频数据中学习强大且可扩展的视觉表征仍然是计算机视觉和自动驾驶领域的一项挑战。我们提出了 MIM4D,一种基于双重遮罩图像建模(MIM)的新的预训练范例,它通过训练遮罩的多视角视频输入来利用空间和时间关系,从而构建伪 3D 特
→
PDF
4 months ago
Prev
Next