生物复杂性中的简洁性

May, 2024

Simplicity within biological complexity

Natasa Przulj, Noel Malod-Dognin

TL;DR利用异质、互连、系统级的分子数据来实现个性化医疗，需要开发一种一般的综合性嵌入多尺度分子网络数据的框架，以实现在线性时间内对其进行可解释性利用。

Abstract

Heterogeneous, interconnected, systems-level, molecular data have become increasingly available and key in precision medicine. We need to utilize them to better stratify patients into risk groups, discover new biomarkers and targets, repurpose known and discover new drugs to personaliz

precision medicine multi-scale molecular network data network embedding methods biomedical applications multi-omic network data

发现论文，激发创造

生物医学大数据时代的网络医学

综述了现有的网络类型和生物医学数据来源，并提出了三种网络医学方法，探讨各种网络方法工作的哲学。通过将生物医学数据与网络相结合，可以用于识别治疗靶点，从而改善个性化医疗的预防医学。

Mar, 2019

在生物医学网络上的图嵌入：方法、应用和评估

本文选择 11 种代表性的图嵌入方法，对药物 - 疾病关联、药物 - 药物交互、蛋白质 - 蛋白质相互作用、医学术语语义分类和蛋白功能预测等 5 个生物医学任务的 3 种预测方法进行评估比较，并提出了挑选嵌入方法和设置超参数的普适指导原则。结果表明，最近的图嵌入方法在未使用任何生物学特征的情况下，能够取得与具有生物学特征的方法相媲美的预测性能。

Jun, 2019

生物和医学数据集成的机器学习：原理、实践和机遇

本综述介绍了多种技术在生物医学领域上的成功应用，讨论了数据整合的原则、当前方法和可用的实现，探讨了综合方法的挑战和未来发展方向。

Jun, 2018

复杂代谢网络的功能制图

利用复杂网络图谱学方法，分析 12 种不同生物群体中代谢网络的功能模块和节点的通用角色，并发现低程度的代谢物比枢纽更具有进化稳定性。

Feb, 2005

将复杂性嵌入数据表示而非模型：异质医学数据案例研究

本文提出使用语义嵌入方法，将原始、杂乱的临床数据直接与下游学习架构耦合，以实现最小化预处理。我们从捕捉和编码数据表示中的复杂数据依赖性的角度考虑这一步骤，而不是在模型中实现，该方法允许使用快速，轻量级和简单的模型进行下游处理，对于没有机器学习专业知识的研究人员非常有用。我们通过三个典型的临床预测任务证明了高度压缩的嵌入数据表示捕获了大量有用的复杂性，尽管在某些情况下，压缩并非完全无损。

Feb, 2018

组织特异性多组学图表示学习

本研究利用图嵌入模型（即 VGAE）对组织特异性基因基因相互作用网络进行链接预测。经过消融实验，我们证明了多个生物模态（即多组学）的组合会导致更强大的嵌入并提高链接预测性能。我们的结果表明，基因甲基化和 RNA 测序数据的整合显着提高了链接预测性能。总体而言，RNA 测序和基因甲基化数据的组合使得基因基因相互作用网络上的链接预测准确率达到了 71％。本研究通过对多组学数据的图表示学习，为当前有关生物信息学中多组学整合研究带来了新的见解。

Jul, 2021

HeteroMed: 基于异构信息网络的医疗诊断

本研究介绍了一种新的基于异构信息网络 HeteroMed 的疾病诊断建模方法，该方法可以更好地在电子医疗记录中处理缺失值和异构数据，并通过关键诊断路径的捕获和联合嵌入来实现更准确的疾病诊断，其实验结果表明，该方法比现有方法在明确的诊断编码和一般疾病群的预测方面表现更好，并且在通过案例研究定性考察临床事件的相似性方面也优于基准模型。

Apr, 2018

发掘多机构数据的力量：整合和协调跨机构的基因组数据

癌症是由基因组变异驱动的复杂疾病，肿瘤测序成为癌症患者临床护理的核心，多机构测序数据的出现为增强精准肿瘤学提供了有力资源。然而，利用这种多机构测序数据面临着重大挑战，包括基因面板的差异导致常见基因集上信息的丢失，测序技术和机构间患者异质性的差异增加了复杂性，高数据维度、稀疏基因突变模式和个体基因水平的弱信号进一步复杂化了情况。为了克服这些实际挑战，我们介绍了 Bridge 模型，它采用分位匹配的潜变量方法来获得整合特征，以保留超出常见基因之外的信息，并最大限度地利用所有可用的数据，同时利用信息共享来增强学习效率和模型的泛化能力。通过提取协调和去噪的低维潜变量，捕捉到了每个个体独特的真实突变模式。我们通过广泛的模拟研究评估了模型的性能和参数估计，从 Bridge 模型中提取的潜变量特征在 GENIE BPC 数据中始终表现出色，可以预测六种癌症类型中的患者生存情况。

Jan, 2024

生物医学知识图谱嵌入的基准与最佳实践

利用知识图谱嵌入学习方法，探索在 SNOMED-CT 知识图谱中学习生物医学知识表征的能力，提供性能测试及最佳实践，并强调利用知识图谱多关系特性学习知识表征的重要性。

Jun, 2020

基于图表示学习的组学数据策略：帕金森病案例研究

该研究评估了在应用于帕金森病和对照样本的高通量生物数据的病例对照分类中，基于样本相似性网络和分子相互作用网络的多个图表示学习模型，包括蛋白质 - 蛋白质和代谢物 - 代谢物相互作用。通过系统应用于转录组学和代谢组学数据的比较分析，突出了各种架构在提取组学数据模式方面的优点和局限性，为生物医学研究中更准确、可解释的模型铺平了道路。

Jun, 2024