Gollum: 大规模多源知识图谱匹配的黄金标准
本文介绍了一个名为 SiGMa 的算法,它是一种对齐具有数百万实体和事实的知识库的简单且高效的算法,并且可以在准确性和效率方面优于现有方法。
Jul, 2012
本文介绍 KGTK 工具集,它是一个数据科学中心化的工具集,旨在表示、创建、转换、增强和分析知识图谱。通过以表格形式表示图形并利用为数据科学应用程序开发的流行库,可以让更广泛的开发人员轻松构建其应用程序的知识图管道。
May, 2020
介绍CoDEx,这是一组知识图谱补全数据集,来源于Wikidata和Wikipedia。与现有的补全基准相比,CoDEx在范围和难度上都有所改进,包含三个大小和结构差异的知识图谱、实体和关系的多语言描述以及数万个可信但已经被验证为错误的负三元组。在实证分析和基准实验的帮助下,我们对CoDEx进行特征描述和区分其与FB15K-237知识图谱完成数据集的区别。
Sep, 2020
提出一种评估候选知识图谱对任务匹配度的方法,揭示了知识任务匹配在知识-任务识别、知识-任务对齐和知识-任务整合等三个阶段中完成的。通过常识探针测量我们的基于变压器的知识图谱-任务模型在知识集成之前和之后捕获的知识量,并使用三个不同的知识图谱验证了我们的方法和发现。
Apr, 2021
本文研究了知识图谱和预训练语言模型相结合的文本分类任务,对常见的文本到知识图谱对齐方法进行了评估,结果表明当前的方法相对于完全相关的查询子图存在一定的局限性。
Jun, 2023
KG-GPT是一个多功能框架,利用大型语言模型(LLMs)进行知识图谱(KGs)相关任务的复杂推理,将句子分割、检索相关图谱组件和推导逻辑结论分为三个步骤。我们通过使用基于KG的事实验证和KGQA基准来评估KG-GPT,发现该模型表现出竞争力和稳健性,甚至胜过几个完全监督的模型。因此,我们的工作在统一LLMs的结构化和非结构化数据处理方面迈出了重要的一步。
Oct, 2023
在这篇论文中,我们对来自各个领域(如自然科学、医学和自然语言处理)的29个真实知识图谱数据集进行了大规模比较研究,分析了它们的属性和结构模式,并根据发现提出了针对基于知识图谱模型开发和评估的几项建议。我们相信知识图谱中丰富的结构信息可以有益于各个领域更好地发展知识图谱模型,并希望这项研究能够有助于打破现有领域间的数据孤岛(例如机器学习、自然语言处理和科学人工智能之间的联系)。
Nov, 2023
通过将小规模专业领域知识图谱与已建立的通用知识图谱进行关联,我们提出了一个框架来丰富领域特定知识图谱的嵌入,以应对大规模知识密集型任务中存在的挑战。实验评估表明,通过与大规模通用知识图谱的链接,采用我们的方法可以显著提升下游任务的性能,Hit@10指标的提升可达44%。这一相对未经探索的研究方向可以促使知识图谱在知识密集型任务中更频繁地应用,从而得到更强大、可靠且不那么虚幻的机器学习实现。
May, 2024
本研究采用基于机器学习的框架进行知识图谱扩展,包括一种新颖的基于属性的对齐方法,能够在无需在先决条件中使用实体类型(etype)标签匹配的情况下对其进行对齐,实验结果定量和定性地证明了知识图谱对齐方法的有效性和所提出的知识图谱扩展框架的优越性。
Jul, 2024