Feb, 2025

AtmosSci-Bench:评估大型语言模型在大气科学中的最新进展

TL;DR本研究解决了在大气科学领域有效利用大型语言模型(LLMs)所需的评估基准缺失问题。论文提出了一个新颖的评估框架AtmosSci-Bench,旨在系统评估LLMs在水文学、大气动力学、大气物理、地球物理和物理海洋学等五大核心领域的表现。研究表明,AtmosSci-Bench可为气候服务中LLMs的应用提供标准和严谨的评估支持。