AptRank:一种适应性 PageRank 蛋白质功能预测模型在双向图上
自动蛋白质功能预测是一项大规模多标签分类问题,它旨在通过自动化蛋白质富集分析,消除对耗时的湿实验方法的依赖。通过仅使用蛋白质序列进行预测的方法逐渐提高可靠性和降低计算成本。因此,我们提出了一种基于序列的层次预测方法 DeepGATGO,它以层次化的方式处理蛋白质序列和 GO 术语标签,并利用图形注意力网络(GATs)和对比学习进行蛋白质功能预测。实验证明,我们提出的模型在大规模数据集上的 GO 术语富集分析中具有更好的可扩展性。
Jul, 2023
从蛋白质互作网络出发,通过减少与不同分类的互作蛋白质的数量来为蛋白质分配功能类别,该方法在酵母细胞蛋白质相互作用网络中得到应用并经过删除 / 插入互作关系的测试,在大量未分类蛋白质存在的情况下具有鲁棒性。
Jun, 2003
本文研究了基于图的连接结构和先前的节点信息(我们称之为查询向量)来排名双分图顶点的问题,并介绍了一种新的解决方案 BiRank,该方案通过迭代分配分数,最终收敛为唯一的静态排序,并且展示了其在实际应用上的灵活性和实用性。
Aug, 2017
蛋白质功能注释是生物学中一个重要且具有挑战性的任务。最近的深度学习进展显示出通过学习蛋白质序列和结构,准确预测功能的巨大潜力。然而,这些基于预测器的方法通常忽视了蛋白质相似性建模,这是传统方法中使用序列或结构检索工具常用的思路。为了填补这一空白,我们首先通过在蛋白质功能注释任务上对比使用预测器的基准方法与使用检索器的方法,研究了蛋白质相似性建模的效果。我们的结果显示,无需大规模预训练,检索器可以与或胜过预测器。基于这些见解,我们引入了一种新颖的变分伪似然框架 ProtIR,旨在通过引入蛋白质相似性建模来改善功能预测器。该框架通过迭代地改进功能预测器和检索器之间的知识来结合两者的优势。ProtIR 在改良的预测器方法上展示了约 10% 的改进效果,并且在性能上与基于蛋白质语言模型的方法相媲美,而无需进行大量的预训练,突显了我们框架的有效性。代码将在接受后发布。
Feb, 2024
本文提出了一种使用深度学习从蛋白质序列及其相互作用网络中预测蛋白质功能的方法,并结合 Gene Ontology 分类蛋白质功能。实验表明该方法能够显著提高蛋白质功能预测的准确性,特别是细胞定位的预测。
May, 2017
该研究针对蛋白质 - 蛋白质相互作用网络对齐问题,提出了基于图匹配算法的两种解决方案,分别基于序列相似性和相互作用保守性,两种新算法均优于现有算法,可检测到更多的已知保守性交互作用。
May, 2009
蛋白质相互作用(PPI)在广泛的生物过程中起着关键作用。本文回顾了各种基于图的方法,并讨论了它们在 PPI 预测中的应用。我们将这些方法分为两个主要组,一类采用图神经网络(GNN)或图卷积网络(GCN),而第二类则利用图注意力网络(GAT)、图自编码器和 Graph-BERT。我们强调每种方法在处理 PPI 网络中的图结构数据方面的独特方法,并预测在此领域的未来研究方向。
Apr, 2024
使用基于 BioBERT 的深度学习技术从 PubMed 文摘中提取蛋白质相互作用 (PPI) 的功能类型,对这些信息进行标注。这项工作证明了通过对生物医学文摘的分析,可以大规模提高在线数据库中带有功能注释的蛋白质相互作用的数量。
Aug, 2020
本文提出了一种利用半监督图卷积网络(GCN)在蛋白质 - 配体亲和性(PLA)预测中整合了相似困难样本的方法,通过同时检索相似困难样本、学习蛋白质 - 配体描述符、学习输入样本的图拓扑结构以及使用半监督 GCN 进行任务预测,显著优于相似方法。
May, 2024
通过深度学习及图神经网络,使用蛋白质的大规模语言模型提取特征,针对蛋白质复合物中的多个氨基酸替代预测结合亲和力的变化
May, 2024