Nov, 2023

ADriver-I: 无人驾驶的通用世界模型

TL;DR基于多模态大语言模型和扩散技术,我们提出了一种自主驾驶世界模型 ADriver-I,该模型以交织的视觉 - 动作对为基础,能够预测当前帧的控制信号,并使用历史的视觉 - 动作对和生成的控制信号来预测未来的帧,通过无限反馈循环,ADriver-I 实现了自主驾驶。我们通过在 nuScenes 和大规模私有数据集上进行广泛实验,证明了 ADriver-I 在性能上的卓越表现,希望该模型能为未来自主驾驶和具身智能提供新的洞见。