Sep, 2023

材料科学知识图谱问答(KGQA4MAT):为金属有机框架知识图谱(MOF-KG)开发自然语言接口

TL;DR我们提出了一个全面的知识图谱问答材料科学(KGQA4MAT)的基准数据集,重点关注金属有机框架(MOFs)。通过整合结构化数据库和从文献中提取的知识,构建了金属有机框架知识图谱(MOF-KG)。为了提高专家查询 MOF-KG 的可访问性,我们旨在开发一个自然语言接口。我们开发了一个包含 161 个复杂问题的基准,涉及比较、聚合和复杂的图结构。每个问题重新表述为另外三个变体,总共有 644 个问题和 161 个 KG 查询。为了评估基准,我们开发了一种系统方法,利用 ChatGPT 将自然语言问题翻译成形式化的 KG 查询。我们还将该方法应用于著名的 QALD-9 数据集,展示了 ChatGPT 在不同平台和查询语言上解决 KGQA 问题的潜力。该基准和提出的方法旨在促进进一步研究和开发用户友好高效的领域特定材料科学知识图谱查询接口,从而加速新材料的发现。