从文本资源自动构建算法知识图谱的方法
利用无监督学习方法构建知识图谱,将自然语言概念实体与源代码实体相关联,结合词嵌入、降维和聚类技术的文本概念聚类方法,用于帮助科学家理解、组织和比较开放科学生态系统中的软件,并增强对科学文献的整体理解。
Aug, 2019
本论文提出一种数学知识图谱(Math-KG),通过自然语言处理技术利用百度百科和维基百科构建,旨在解决在线教育平台上的信息过载和知识跟踪问题,并提供了一个简单的应用系统进行实验验证。
May, 2022
本文论述如何为知识图谱的建设和持续更新提供通用管道,谈论了高质量 KG 的必需步骤,包括元数据管理,本体开发和质量保证,并对 KG 建设工具和策略的现状进行评估和总结,并提出了需要进一步研究和改进的领域。
Feb, 2023
本文研究了知识图谱和预训练语言模型相结合的文本分类任务,对常见的文本到知识图谱对齐方法进行了评估,结果表明当前的方法相对于完全相关的查询子图存在一定的局限性。
Jun, 2023
本篇论文旨在开发一种新颖的域独立自动本体生成框架,将非结构化文本语料库转换为与领域本体一致的形式,该框架从非结构化文本语料库生成知识图谱,并对其进行精细化的改进和纠正,以达成动态特征与本体质量特征的有机结合。
Jan, 2022
医疗知识图谱自动化 (M-KGA) 是一种创新方法,通过利用用户提供的医学概念并利用 BioPortal 本体进行语义增强,以整合预训练嵌入向量,从而提高知识图谱的完整性。该方法引入了基于聚类和基于节点的两种方法,以发现知识图谱中隐藏的连接,通过对电子健康记录中 100 个频繁出现的医学概念进行严格测试,展示了有望解决现有知识图谱自动化技术限制的潜力。
Apr, 2024
本文介绍了利用基于实体和关系的数据构建知识图谱的方法以及将众包方法应用于知识图谱构建,在制造业领域中建立了一个包含 65000 + 三元组的 FabKG,并展示了区分领域特定问题和基于表达式 / 公式的问题的用例。
May, 2022