Jun, 2024
WeatherQA: 多模态语言模型能否推理严重天气?
WeatherQA: Can Multimodal Language Models Reason about Severe Weather?
Chengqian Ma, Zhanxiang Hua, Alexandra Anderson-Frey, Vikram Iyer, Xin Liu...
TL;DR多模态数据集 WeatherQA 是用于预测复杂的恶劣天气事件的第一个数据集,使用视觉语言模型评估模型在多选问题和危险密度分类任务上表现较人类推理薄弱,需要更好的训练和数据整合来弥合差距。