Sep, 2024

OccLLaMA:一种用于自动驾驶的占用语言行动生成世界模型

TL;DR本研究解决了多模态大语言模型在自动驾驶中对世界动态和行动关系的忽视问题,提出了OccLLaMA模型,该模型通过语义占用作为视觉表示,统一视觉、语言和行动模态。重要发现表明,OccLLaMA在多个自动驾驶任务中表现出竞争力,展示了其作为基础模型的潜在应用价值。