May, 2024

视觉语言基础模型中的运动预测中的难例检测

TL;DR该研究探讨了使用 Vision-Language Foundation Models(VLMs)在自动驾驶中检测困难案例的潜力,并展示了 VLMs 在交通参与者运动预测中检测困难案例的能力。通过 VLMs 检测困难案例,进一步提高了现有运动预测流程的训练效率。