Jun, 2024

CarLLaVA: 基于视觉和语言模型的无需传感器驱动闭环驾驶

TL;DRCarLLaVA 是一种用于自主驾驶的视觉语言模型,通过 LLaMA 架构和 LLaVA VLM 的视觉编码器实现闭环驾驶性能的最新进展,无需复杂或昂贵的标签,并通过行驶输出展示了预测语言评论的初步结果。