Jan, 2024

LLaMP: 用于高保真材料知识检索和蒸馏的大型语言模型

TL;DR在科学领域,LLMs 的幻觉问题是必须解决的,因为可重现性是至关重要的。本文介绍了 LLaMP,这是一个多模态检索增强生成(RAG)框架,由多个数据感知推理和行动(ReAct)代理组成,动态与 Materials Project(MP)上的计算和实验数据交互。LLaMP 在不进行精细调整的情况下,能够理解和整合各种材料科学概念的多模态信息,实时获取相关数据,处理高阶数据(如晶体结构和弹性张量),并对固态合成的多步骤过程进行总结。同时,LLaMP 能有效纠正 GPT-3.5 在频繁文档中的带隙和形成能量方面的错误,并将钻立方硅结构的虚幻体积应变从 66.3%降低到 0。该框架为材料信息学提供了一种直观且几乎无幻觉的方法,并为知识蒸馏和精细调整其他语言模型奠定了基础。我们设想该框架作为科学假设的有价值组成部分,并为未来的自主实验室奠定基础,多个 LLM 代理与机器人通信和协作,驱动材料合成和化学反应,无需硬编码的人类逻辑和干预。