Nov, 2023

驶向未来:基于世界模型的自动驾驶多视角视觉预测和规划

TL;DR自主驾驶中,通过预测未来事件并评估可预见的风险,使自动驾驶汽车能够更好地规划动作,提高道路安全和效率。我们提出了 Drive-WM,这是第一个与现有端到端规划模型兼容的驾驶世界模型。通过视图因式分解实现的联合时空建模,我们的模型在驾驶场景中生成具有高保真度的多视图视频。基于其强大的生成能力,我们首次展示了将世界模型应用于安全驾驶规划的潜力。特别是,我们的 Drive-WM 能够根据不同的驾驶操纵方式驾驶到多个未来,并根据基于图像的奖励确定最佳轨迹。对真实驾驶数据集的评估验证了我们的方法能够生成高质量、一致性和可控性的多视图视频,为真实世界模拟和安全规划开辟了新的可能性。