AtomSurf:蛋白质结构学习的表面表示
本文介绍了一种利用无监督对比学习来学习有意义的蛋白质结构表示的框架,其利用蛋白质数据银行中的蛋白质,展示了这些表示可以用于解决多种任务,如蛋白质功能预测、蛋白质折叠分类、结构相似性预测和蛋白质配体结合亲和力预测。此外,作者还表明,使用该算法预训练的微调网络在许多任务中取得了新的最优结果。
May, 2022
本文提出了一种多尺度图构建方法 ——HoloProt,可以连接蛋白表面、结构和序列,并在不同任务上进行了测试,包括配基结合亲和力回归和蛋白质功能预测分类。该模型具有良好的稳定性和可靠性,并且在减少参数数量的情况下可以获得与现有模型相当的性能。
Apr, 2022
在结构生物信息学中,蛋白质间相互作用的预测是最重要且具有挑战性的问题之一。本文提出了一种基于深度学习技术的分层化化学和几何特征交互网络(HCGNet),通过建立化学特征和几何特征之间的分层交互来进行蛋白质表面分析,并通过大量实验证明我们的方法在位点预测任务和相互作用匹配任务上优于之前的最先进方法,分别提高了 2.3% 和 3.2%。
Jan, 2024
本文提出了利用 3D 蛋白结构进行预训练的蛋白质表示方法,并通过多视图对比学习和自我预测任务,实现了对蛋白质的编码。实验结果表明,该方法不仅可以比现有的基于序列的方法更有效地预测蛋白质的功能和褶叠分类,而且使用的预训练数据更少。
Mar, 2022
蛋白质表示学习是一个具有挑战性的任务,旨在从其氨基酸序列中捕获蛋白质的结构和功能。本文提出了一种神经聚类框架,通过考虑蛋白质的一级和三级结构信息来自动发现蛋白质的关键部分,在四个蛋白质相关任务上取得了最先进的表现。
Mar, 2024
本研究通过预训练三维蛋白质结构的图神经网络,利用蛋白质的地理层次结构和亚图与全球结构的关系,提出了一种新的自我监督方法,能够显著提高三维图神经网络在不同蛋白质分类任务中的性能表现。
Jun, 2024
ProteinWorkshop 是一套用于蛋白质结构上的几何图神经网络表征学习的全面基准套件,通过对大规模预训练和下游任务进行系统评估,旨在建立机器学习和计算生物学社区之间的共同基础,以严谨地比较和推进蛋白质结构表征学习的研究。
Jun, 2024
通过研究,我们发现当利用 AI 工具(如 AlphaFold2)预测的蛋白质结构时,现有的方法在预测准确性上存在明显的下降,我们将该现象归因于结构表示学习的结构嵌入偏差。为了解决这个问题,我们提出了一种蛋白质结构嵌入对齐优化框架(SAO),并确定了一个稳健蛋白质性质预测的蛋白质三维图结构学习问题(PGSL-RP3),通过大量实验证明了我们的框架在改进预测结构和实验结构的性质预测方面既适用于各种模型,又有效果。
Oct, 2023
我们提出了一种新颖的结构感知的蛋白自监督学习方法,利用图神经网络模型预训练,从残基距离和二面角的角度考虑自监督学习任务,借鉴预训练蛋白语言模型的序列信息结合专门设计的 GNN 模型的结构信息进行伪二级优化,实验证明该方法在多个监督型下游任务中的有效性。
Apr, 2022