Jan, 2024

角度俯视注入多模型的全面自主驾驶理解

TL;DR多模态大语言模型在自动驾驶任务中的应用,使用 NuInstruct 数据集和 BEV-InMLLM 方法进行多视角、时态相关信息的驾驶任务处理,相比现有的大语言模型,BEV-InMLLM 取得约 9% 的性能提升。