Feb, 2023

使用通用语言模型从文本中提取材料数据的灵活模型无关方法

TL;DR本文主要介绍了一种从研究论文全文中提取材料数据以建立数据库的简单方法,该方法基于自然语言处理和大型通用语言模型,无需编程或模型培训等专业知识,可实现高召回率和几乎完美精度。作者还评估了多种语言模型(GPT-3/3.5,bart 和 DeBERTaV3),并在提取体积模量数据方面取得了良好的表现。最后,作者还通过开发金属玻璃的临界冷却速率数据库展示了该方法可以扩展到其他研究领域。