Oct, 2023

基于多组学采样的图变压器模型用于合成致死性预测

TL;DR合成致死(SL)预测用于确定两个基因的共突变是否导致细胞死亡,其中最常见的策略是将 SL 预测抽象为 SL 数据中基因节点的边分类任务,并通过图神经网络(GNNs)实现,然而,GNNs 在信息传递机制中存在一些局限性,包括过度平滑和过度压缩问题,此外,利用大规模多组学数据中非 SL 基因关系的信息来促进 SL 预测带来了非常困难的挑战,为了解决这些问题,我们提出了一种新的基于多组学采样的 SL 预测图变换器(MSGT-SL),具体地,我们引入了一个浅层多视图 GNN 来从 SL 和多组学数据中获取局部结构模式,进一步,我们将编码多视图信息的基因特征输入到标准的自注意力机制中以捕获长程依赖关系,值得注意的是,我们从 SL 数据中的批量基因开始,在包含它们的多个组学基因图之间采用并行随机游走采样,以在使用自注意力机制之前以基于结构的方式有效而适度地将组学基因纳入其中,我们展示了 MSGT-SL 在现实世界的 SL 任务上的有效性,证明了图变换器和多组学数据所带来的经验上的收益。