May, 2024

MagicDrive3D: 街景中任意视角渲染的可控 3D 生成

TL;DR我们引入了 MagicDrive3D,这是一种创新的管道,用于可控的 3D 街道场景生成,支持多条件控制,包括 BEV 地图、3D 对象和文本描述。与先前的方法不同的是,MagicDrive3D 首先训练视频生成模型,然后再进行重建,从而实现了易于控制的生成和静态场景获取,从而实现了高质量的场景重建。通过对 nuScenes 数据集的验证,MagicDrive3D 生成了多样化、高质量的 3D 驾驶场景,支持任意视角渲染,并增强了诸如 BEV 分割之类的下游任务。我们的结果展示了该框架卓越的性能,展示了它在自动驾驶仿真及其他领域的变革潜力。