超越设计师的知识:通过大型语言模型生成材料设计假设
使用大型语言模型解决化学和材料科学中的数据驱动或计算技术的复杂性,从而在各种应用中包括分子和材料的属性预测、设计工具和从非结构化数据中提取知识等领域中产生了巨大的成功。参加的人们利用大型语言模型进行了各种各样的应用,这表明大型语言模型将深刻地影响我们未来的领域。
Jun, 2023
在科学领域,LLMs的幻觉问题是必须解决的,因为可重现性是至关重要的。本文介绍了LLaMP,这是一个多模态检索增强生成(RAG)框架,由多个数据感知推理和行动(ReAct)代理组成,动态与Materials Project(MP)上的计算和实验数据交互。LLaMP在不进行精细调整的情况下,能够理解和整合各种材料科学概念的多模态信息,实时获取相关数据,处理高阶数据(如晶体结构和弹性张量),并对固态合成的多步骤过程进行总结。同时,LLaMP能有效纠正GPT-3.5在频繁文档中的带隙和形成能量方面的错误,并将钻立方硅结构的虚幻体积应变从66.3%降低到0。该框架为材料信息学提供了一种直观且几乎无幻觉的方法,并为知识蒸馏和精细调整其他语言模型奠定了基础。我们设想该框架作为科学假设的有价值组成部分,并为未来的自主实验室奠定基础,多个LLM代理与机器人通信和协作,驱动材料合成和化学反应,无需硬编码的人类逻辑和干预。
Jan, 2024
基于材料科学知识和假设生成及假设测试,我们描述了材料科学LLMs的框架,以及构建大规模多模态数据集的挑战和应用MatSci-LLMs进行材料发现的路线图。
Feb, 2024
我们提供一个对大型语言模型在材料科学研究中的适用性的观点,认为它们处理一系列任务和学科中的模糊需求的能力使它们成为帮助研究人员的强大工具。我们定性地研究了基础的大型语言模型理论,并将其与文献中的相关性质和技术联系起来,然后提供了两个案例研究,展示了它们在大规模任务自动化和知识提取中的应用。我们认为,在当前的发展阶段,大型语言模型应该被视为能够加速和统一领域探索的不知疲倦的工具,而不是新见解的神谕。希望本文能让材料科学研究人员了解到运用这些工具的相关概念。
Mar, 2024
通过收集专家材料偏好的数据集,该研究提供了评估大型语言模型在材料选择方面与专家建议相符程度的基础,并通过提示工程和超参数调整比较了大型语言模型在各种设计情景下与专家选择的性能。该研究的结果强调了大型语言模型在材料选择方面的两种失败模式,并发现并行提示作为一种有用的提示工程方法。研究结果进一步指出,虽然大型语言模型可以提供有价值的帮助,但它们的建议通常与人类专家存在明显差异,这突显了进一步研究如何更好地调整大型语言模型以复制专家决策的重要性。该研究为大型语言模型如何融入设计过程的日益增长的知识库做出了贡献,提供了关于它们当前限制和未来改进潜力的见解。
Apr, 2024
LLMatDesign是一个基于大型语言模型的可解释材料设计框架,通过使用LLM代理来翻译人类指令、修改材料并使用提供的工具评估结果,以零样本的方式适应新任务和条件,通过在几个材料设计任务上系统评估证实其在小数据领域中开发具有用户定义目标属性的新材料的有效性,展示了在计算环境中基于自主LLM引导的材料发现对于未来的自动化实验室的显著潜力。
Jun, 2024
通过MatText套件中的基准测试工具和数据集,我们对语言模型在材料建模方面的性能进行了广泛分析,结果显示这些模型在捕捉关键的材料几何信息方面存在困难,而在某些新颖的表示方法中强调使用局部信息。我们的分析突显出了基于文本方法在材料设计中存在的不足之处。
Jun, 2024
本研究解决了大语言模型在材料科学应用中的稳健性和可靠性不足的问题。通过对多个数据集的综合评估,提出了针对领域特定问答和材料属性预测的新方法,发现模型在面对不同噪声时的表现,旨在提升大语言模型在实际应用中的可靠性和稳健性。
Sep, 2024