通过知识图谱整合异质基因表达数据，提升糖尿病预测能力

Apr, 2024

通过知识图谱整合异质基因表达数据，提升糖尿病预测能力

Integrating Heterogeneous Gene Expression Data through Knowledge Graphs for Improving Diabetes Prediction

Rita T. Sousa, Heiko Paulheim

TL;DR通过整合多个基因表达数据集和领域特定知识，利用知识图谱嵌入方法生成向量表示，并用于分类器，本研究提出了一种新的方法，改善了糖尿病预测。

Abstract

diabetes is a worldwide health issue affecting millions of people. Machine learning methods have shown promising results in improving diabetes prediction, particularly through the analysis of diverse data types,

diabetes machine learning gene expression data knowledge graphs diabetes prediction

发现论文，激发创造

通过整合背景知识图谱实现基因表达分类的端到端框架：应用于癌症预后预测

本研究提出了一种利用背景生物网络信息来构建分类模型的端对端框架，应用于基因表达数据和生物网络来进行癌症预后预测，实验结果表明相比于深度神经网络模型，我们的模型取得了更高的准确性，并通过富集分析鉴定了多种癌症类型的贡献基因和通路，从中识别了已知的生物标志和新的生物标志候选物。

Jun, 2023

基于张量分解的知识图谱补全方法用于疾病基因预测

本文提出了一种基于生物知识图谱和交互张量分解的疾病基因预测知识图谱完成模型，称为 KDGene，该方法显著优于现有算法，并可用于识别新的、准确的候选基因，尤其在糖尿病的案例分析中表现出良好的识别能力，这对进一步的实验提供了有价值的参考。

Feb, 2023

组织特异性多组学图表示学习

本研究利用图嵌入模型（即 VGAE）对组织特异性基因基因相互作用网络进行链接预测。经过消融实验，我们证明了多个生物模态（即多组学）的组合会导致更强大的嵌入并提高链接预测性能。我们的结果表明，基因甲基化和 RNA 测序数据的整合显着提高了链接预测性能。总体而言，RNA 测序和基因甲基化数据的组合使得基因基因相互作用网络上的链接预测准确率达到了 71％。本研究通过对多组学数据的图表示学习，为当前有关生物信息学中多组学整合研究带来了新的见解。

Jul, 2021

利用知识图谱预测药物间相互作用

该论文介绍了一种名为 medicX 的端到端框架，它将来自公共药物库的多种药物特征集成到一个知识图谱中，并使用各种翻译、分解和神经网络方法嵌入图谱中的节点，最终使用机器学习算法来预测未知的药物相互作用。

Aug, 2023

从大型语言模型到知识图谱：癌症生物标志物发现

开发了一个基于领域知识图谱和语义推理的癌症特定生物标志物发现和交互式问答系统，使用生物医学数据、领域本体论、信息提取方法以及大型语言模型进行知识图谱的构建和更新。

Oct, 2023

多模式蛋白知识图谱构建及应用

本文介绍了 ProteinKG65，一个专门用于蛋白质科学的知识图谱，它基于基因本体论和 Uniprot 知识库，并整合了多种知识，主要旨在将基因本体论的知识应用于蛋白质功能及结构预测，文中还展示了 ProteinKG65 的潜在应用。

May, 2022

基于统计和机器学习方法的基因表达谱分析的比较分析

机器学习模型在表达基因数据的表型分类方面取得了好的性能，通过提取决策的解释，这些模型能提供对表型的理解，讨论了这种解释的生物学和方法论限制，并在癌症和健康组织样本的多个数据库上进行了实验。

Feb, 2024

生物复杂性中的简洁性

利用异质、互连、系统级的分子数据来实现个性化医疗，需要开发一种一般的综合性嵌入多尺度分子网络数据的框架，以实现在线性时间内对其进行可解释性利用。

May, 2024

基于知识强化的生成模型改进分子生成与药物发现

通过建立一个名为 K-DReAM 的知识增强生成模型的框架，该研究提出了一个创新方法，以填补生成模型与广泛生物医学知识之间的差距，利用知识图谱的语义信息引导扩散模型，并结合生成模型的功能扩展，从而产生具有特定特征且具备有效性和可合成性的新药候选物。

Feb, 2024

知识图谱嵌入在药物发现中的性能理解

该研究探讨了五个知识图谱嵌入模型在两个以药物发现为导向的公共知识图谱上的预测表现，并发现模型性能受训练设置、超参数选择、模型参数初始化种子以及数据集的不同分割等因素的显著影响。作者强调，为确保未来工作的完全可重现性和公正比较，应将这些因素与模型架构一起报告，并且这对于知识图谱嵌入在生物医学领域的应用和影响至关重要。

May, 2021