癌症生物标志物发现的生物医学知识图谱
开发了一个基于领域知识图谱和语义推理的癌症特定生物标志物发现和交互式问答系统,使用生物医学数据、领域本体论、信息提取方法以及大型语言模型进行知识图谱的构建和更新。
Oct, 2023
我们提出了一个面向生物医学领域的异构知识图谱基准测试平台 Know2BIO,它从 30 个不同的数据源中整合数据,并捕捉了 11 个生物医学类别中的复杂关系。通过在 Know2BIO 上评估知识图谱表示模型,我们展示了其在生物医学领域中作为知识图谱表示学习基准测试的有效性。
Oct, 2023
医疗知识图谱自动化 (M-KGA) 是一种创新方法,通过利用用户提供的医学概念并利用 BioPortal 本体进行语义增强,以整合预训练嵌入向量,从而提高知识图谱的完整性。该方法引入了基于聚类和基于节点的两种方法,以发现知识图谱中隐藏的连接,通过对电子健康记录中 100 个频繁出现的医学概念进行严格测试,展示了有望解决现有知识图谱自动化技术限制的潜力。
Apr, 2024
本文介绍了完全由机器学习算法生成的第一个大规模公开生物医学知识图谱 Biomedical Informatics Ontology System(BIOS),包括生物医学术语的整理、同义词的计算识别、概念节点的聚合、语义类型分类、关系识别和医学机器翻译。结果提示,基于机器学习的 BioMedKG 开发是传统专家编纂的可行替代方案。
Mar, 2022
本文介绍了如何使用 Amazon Alexa 语音界面对知识图谱进行问答。以包含 113 万个基因 - 疾病关联的 DisgeNET KG 为例,研究表明 Alexa 可以帮助从大规模知识库中查找有关某些生物实体的信息。
Oct, 2022
RNA-KG 是一个包含来自 50 多个公共数据库的 RNAs 的生物知识图谱,集成了与基因、蛋白质和化学物质的功能关系以及本体论基础的生物医学概念;通过利用基于实例的语义抽象知识模型生成 RNA-KG,并对其进行拓扑分析,RNA-KG 可以被直接探索、可视化,或通过计算方法推断其异质节点和边缘中的生物医学知识。
Nov, 2023
这篇研究论文探讨了如何使用自然语言问答,相结合的语言模型和 KG 嵌入来回答生物学家们所提出的一系列自由形式的问题,其 KG 数据集来源于 Hetionet,并利用该数据集创建一个多跳生物医学问答数据集以测试多跳生物医学问答系统。
Nov, 2022
本文首次提出了领域特定知识图谱的综合定义,并针对七个领域的相关学术作品,提出了最先进的知识图谱构建方法进行了全面的回顾。审视当前方法时,揭示了一系列的局限和不足,同时还强调指出了文献中现存问题和未知的研究方向。
Oct, 2020
本文介绍了利用基于实体和关系的数据构建知识图谱的方法以及将众包方法应用于知识图谱构建,在制造业领域中建立了一个包含 65000 + 三元组的 FabKG,并展示了区分领域特定问题和基于表达式 / 公式的问题的用例。
May, 2022
KG-Hub 是一个平台,它通过一种简单、模块化的提取 - 转换 - 加载(ETL)模式来生成符合 Biolink Model 的图形数据,易于集成任何 OBO 本体论,支持对上游数据源的缓存下载、版本化和自动更新构建,提供易于重复使用的转换子图,并支持基于知识图的机器学习。
Jan, 2023