KDDJul, 2023

DeepGATGO: 基于分层预训练的图注意力模型用于自动蛋白质功能预测

TL;DR自动蛋白质功能预测是一项大规模多标签分类问题,它旨在通过自动化蛋白质富集分析,消除对耗时的湿实验方法的依赖。通过仅使用蛋白质序列进行预测的方法逐渐提高可靠性和降低计算成本。因此,我们提出了一种基于序列的层次预测方法 DeepGATGO,它以层次化的方式处理蛋白质序列和 GO 术语标签,并利用图形注意力网络(GATs)和对比学习进行蛋白质功能预测。实验证明,我们提出的模型在大规模数据集上的 GO 术语富集分析中具有更好的可扩展性。