Jan, 2024

自动驾驶的视觉语言规划

TL;DR自主驾驶中的场景理解和推理是复杂而具有挑战性的任务。本文提出了一种新颖的 Vision-Language-Planning(VLP)框架,通过利用自然语言模型来弥合语义理解和自主驾驶之间的鸿沟,从而增强自动驾驶系统的规划性能,提高在挑战性场景中的表现,以及在面对新型城市环境时的强大泛化能力。