使用等变去噪扩散概率模型生成蛋白质结构与序列
本研究提出了一种潜在的扩散模型,该模型可以在凝聚的潜在空间中灵活捕捉天然蛋白质结构的分布,从而通过等变蛋白自编码器生成高可设计性和高效率的新型蛋白质骨架结构。
May, 2023
本研究介绍了一种新的基于扩散的生成模型,通过模拟蛋白质的折叠过程,使用一系列连续角度来生成新的蛋白质骨架结构,通过简单的 transformer 骨干训练出高质量的蛋白质结构,并开源了对应的代码库和训练模型。
Sep, 2022
本文提出了一种基于上下文特征的三角函数编码器和旋转平移等变解码器,能够在随机初始化的基础上迭代地将蛋白质序列和结构转化为所需状态,从而设计高保真度的蛋白质的新方法。实验结果表明,该方法在多项任务上均优于现有基线算法,而且比基于抽样的方法更快且可靠。
Oct, 2022
提出了一种新颖的图去噪扩散模型,使用氨基酸替代矩阵对扩散过程进行编码,并在多种基准方法中实现了最先进的序列恢复性能,为特定的蛋白质骨架结构生成多样性的蛋白序列具有极大的潜力。
Jun, 2023
使用 EigenFold 这种扩散生成建模框架,以从给定蛋白质序列中生成结构的分布,更全面地了解模型不确定性,并评估 EigenFold 对于建模和预测折叠转换蛋白质和配体诱导构象变化的能力,该方法在最近的 CAMEO 目标中实现了中位 TMScore 为 0.84,可以更好地捕捉构象情况下的生物学功能。
Apr, 2023
利用 E (3)- 等变图神经网络学习分布并通过 SMCDiff 有效地从大量的蛋白质背骨结构中对指定基序进行条件采样构造支架结构,可在保证结构多样性的情况下采样长达 80 个氨基酸残基长度的支架,同时对于固定的基序可获得多样性的构架结构。
Jun, 2022
我们提出了一种力导向的 SE (3) 扩散模型 ConfDiff,用于蛋白质构象的生成,该模型融合了力导向网络和基于数据的评分模型,能够生成具有多样性且高保真性的蛋白质构象。实验证明,我们的方法在多种蛋白质构象预测任务中优于现有方法。
Mar, 2024
设计合理的蛋白质序列和结构是至关重要的,我们提出了一种基于功能位点的 NAEPro 模型,该模型通过网络注意力和等变层来联合设计蛋白质序列和结构,在两个层次上进行有效而经济的信息传递,实验证明该模型能够设计出与自然蛋白质序列和结构非常相似且具有高度效能的蛋白质。
Oct, 2023
利用基于蛋白质为环境约束的扩散模型,在非自回归的完整原子水平上,去噪元素类型和整个分子的三维坐标,学习生成过程,相较其他方法具有更高的相似性和更适当的分子大小以及其他药物性质。
Nov, 2022