Sep, 2024
大型视觉-语言模型能否获得驾驶执照?面向可靠通用人工智能的基准研究
Can LVLMs Obtain a Driver's License? A Benchmark Towards Reliable AGI
for Autonomous Driving
TL;DR本研究关注当前大型视觉-语言模型在自动驾驶中的专业性缺失,提出IDKB数据集以填补这一空白。IDKB包含来自多个国家的驾驶手册、理论测试数据和模拟路考数据,为自动驾驶模型提供全面的驾驶知识。在对15个LVLM进行测试后,发现经过微调的模型显著提升了性能,验证了该数据集的重要性。