Oct, 2023

多视图变分自动编码器在非靶向代谢组学中的缺失值填补

TL;DR本研究提出了一种新的方法,利用全基因组测序(WGS)数据和参考代谢物对未知代谢物进行插补。该方法通过多视图变分自编码器来联合建模负担得分、多基因风险得分(PGS)和连锁不平衡(LD)剪辑单核苷酸多态性(SNPs),以进行特征提取和代谢组学数据插补。通过学习两种组学数据的潜在表示,我们的方法可以基于基因组信息有效地插补缺失的代谢物值。本研究证明了该方法在实际代谢组学数据集上对缺失值进行插补的性能优于传统的插补技术,将全基因组测序数据与代谢组学数据整合不仅可以提高数据的完整性,而且可以增强下游分析,为代谢途径和疾病关联的更为全面和准确的研究铺平了道路。