Sep, 2024

交通工程问题的视觉语言模型评估与比较

TL;DR本研究针对视觉语言模型在交通工程任务中的应用,探讨了现有模型在图像分类和目标检测中的表现,特别是拥堵检测和裂缝识别。通过采用零-shot 提示方法评估多种开源和闭源模型,发现尽管这些模型在图像分类任务中表现与传统卷积神经网络相当,但在目标定位上仍需改进,为未来研究提供了基准和改进方向。