Aug, 2024

在占用世界中驾驶:基于视觉的4D占用预测与自主驾驶的世界模型规划

TL;DR本研究解决了现有世界模型在数据生成和预训练方面的局限,提出了Drive-OccWorld模型,实现视觉中心的4D占用预测与自主驾驶的端到端规划。通过引入语义和运动条件的标准化,使模型能够考虑几何和时空建模,有效生成占用预测,为自主驾驶的未来状态预测和最优轨迹选择提供了新的可能性。