Aug, 2024

MaterioMiner - 基于本体的文本挖掘数据集,用于提取过程-结构-性质实体

TL;DR本研究填补了本体与文本语料之间的数据集缺口,提出了MaterioMiner数据集和材料力学本体。通过179个类别的细粒度标注,该数据集可用于训练和基准测试神经符号模型,实现了命名实体识别模型训练的可行性,推动了材料语言模型的开发和知识图谱的生成。