Jul, 2023

基于癌症多组学数据的多头注意机制学习癌症新亚型和治疗

TL;DR我们提出了一个基于注意力机制的无监督对比学习框架(AMUCL),用于分析癌症多组学数据以识别和表征癌症亚型。其中,基于多头注意力机制的 DMACL 模型用于学习多组学数据特征和聚类,并识别新的癌症亚型。通过计算特征空间和样本空间中样本之间的相似性,该无监督对比学习方法将亚型聚类。相较于其他 11 个深度学习模型,在单细胞多组学数据集上,DMACL 模型获得了 0.002 的 C-index、0.801 的轮廓系数和 0.38 的戴维森堡丁指数。在癌症多组学数据集上,DMACL 模型获得了 0.016 的 C-index、0.688 的轮廓系数和 0.46 的戴维森堡丁指数,为每种癌症类型提供了最可靠的癌症亚型聚类结果。最后,我们在 AMUCL 框架中使用 DMACL 模型揭示了 AML 的六个癌症亚型,并通过 GO 功能富集分析、亚型特定的生物学功能和 AML 的 GSEA 进一步提高了基于可推广的 AMUCL 框架的癌症亚型分析的解释能力。