Jan, 2024

利用大型语言模型从材料科学文献中挖掘实验数据

TL;DR评估先进的大型语言模型(LLMs)在材料科学领域的科学文档中提取结构化信息的能力,并引入了一种比较分析复杂材料表述的新方法,重点是采用化学式的标准化来解决材料科学信息评估中固有的复杂性。LLMs 在指定的两个关键任务中展现出不同的表现:对于命名实体识别(NER)任务,LLMs 未能超越基准模型和规则基模型,对于关系抽取(RE)任务,经过适当策略的 GPT-3.5-Turbo 优于所有模型,而 GPT-4 和 GPT-4-Turbo 在没有经过任何调优的情况下,在仅提供几个示例的情况下展示出出色的推理和关系抽取能力,超越了基准模型。总体而言,结果表明,虽然 LLMs 在连接概念方面展示出相关的推理能力,但对于需要提取复杂领域特定实体(如材料)的任务来说,专门的模型目前是更好的选择。