本篇论文探讨了知识图谱的构建与查询,结合深度学习、信息检索和自然语言处理等学科展开研究,提出了一些新的挑战和机会。
May, 2023
本文研究了将知识图谱转化为自然语言文本的任务,主要讨论了广泛的开放领域大规模语言生成的挑战,将知识图谱转化为自然语言文本,从而提高了语言模型的事实准确性和减少了毒性。通过对开放领域 QA 和 LAMA 知识探测的任务进行评估,表明该方法在文本检索方面有很大的优势。
Oct, 2020
本文提出了 KGQAn,一个通用的 QA 系统,它不需要为每个目标 KG 进行定制,而是采用一种新颖的形式化方法将问题理解为一个文本生成问题,并通过神经序列到序列模型将问题转换为中间抽象表示。我们还开发了一个即时链接器,在查询时间使用 RDF 存储的公共可访问 API 和现有索引将抽象表示映射到特定 KG 的 SPARQL 查询,而无需任何预处理。我们在几个真实的 KG 上进行的实验表明,KGQAn 易于部署,对于任意的 KG 表现良好,优于现有的 QA 系统。
Mar, 2023
本文介绍了利用基于实体和关系的数据构建知识图谱的方法以及将众包方法应用于知识图谱构建,在制造业领域中建立了一个包含 65000 + 三元组的 FabKG,并展示了区分领域特定问题和基于表达式 / 公式的问题的用例。
May, 2022
本研究提出一种针对知识图谱(如 DBpedia)自动生成知识问题的方法,通过使用端到端的方法,包括实体选择、三元组查询、答案选择和自然语言问句生成,并使用历史数据和训练分类器来估计问题难度。最后的实验证明了这种方法的可行性。
Oct, 2016
介绍了知识图谱的概念和应用,比较了多个公开的知识图谱的内容、大小、覆盖范围和重叠程度,其中包括互联网巨头谷歌的知识图谱和公共数据库 DBpedia。
Mar, 2020
医疗知识图谱自动化 (M-KGA) 是一种创新方法,通过利用用户提供的医学概念并利用 BioPortal 本体进行语义增强,以整合预训练嵌入向量,从而提高知识图谱的完整性。该方法引入了基于聚类和基于节点的两种方法,以发现知识图谱中隐藏的连接,通过对电子健康记录中 100 个频繁出现的医学概念进行严格测试,展示了有望解决现有知识图谱自动化技术限制的潜力。
Apr, 2024
通过使用知识图谱增强任务特定的训练程序,我们提出了 KnowledgeDA 作为一个统一而低代码的领域语言模型开发服务,实现了两个领域的语言模型学习,并进行了五项领域特定 NLP 任务的实验证明。
Dec, 2022
这篇文章概述了创建和管理大型知识库的基本概念和实践方法,重点介绍了发现和规范实体及其语义类型、自动提取基于实体的属性以及构建开放架构和知识管理的方法。
Sep, 2020
基于问题回答技术,本研究提出了一个能从网页中提取新事实并推荐给 Wikidata 编辑人员验证的框架,并通过利用 Wikidata 中已有的信息,无需额外学习信号便可训练该框架来提取各种属性和领域的新事实,实验结果表明平均 F1 得分为 84.07,在人类验证之前,有潜力提取数百万条事实,旨在帮助编辑人员的日常任务,完善 Wikidata 知识图谱。
Jan, 2024