Sep, 2024

MaterialBENCH:评估大学水平材料科学的问题解决能力的大型语言模型

TL;DR本研究构建了一个针对大型语言模型(LLMs)在材料科学领域的大学水平基准数据集MaterialBENCH,旨在评估其解决相关问题的能力。通过实验,本研究发现不同类型问题的表现差异,并讨论了如何提高模型在复杂问题解决上的推理能力,从而推动材料研究和发现的进展。