AlphaFold 加速 AI 驱动药物研发:高效发现一种新型细胞周期依赖性激酶 20(CDK20)小分子抑制剂
通过引入 APACE 作为计算框架,将 AlphaFold2 和先进计算作为服务相结合,可以在现代超级计算环境中加速蛋白质结构预测分析,从而将蛋白质结构预测的时间从数周缩短到数分钟。
Aug, 2023
本文提出了 FastFold,它是 AlphaFold 模型的有效实现,使用 Dynamic Axial Parallelism 和 Duality Async Operations 提高模型并行性的扩展效率,还提出 AutoChunk 来自动确定块策略以减少推理期间的内存成本,实验结果表明,FastFold 将总的训练时间从 11 天缩短至 67 小时,在长序列推理中达到了 7.5-9.5 倍的加速,此外,我们将 FastFold 扩展到了 512 个 GPU,实现了 6.02 PetaFLOP/s 的总吞吐量和 90.1% 的并行效率。
Mar, 2022
ExplainableFold 是一个对于蛋白质结构预测的可解释人工智能框架,提出了基于对生物学原理的启示,生成蛋白结构预测的反事实说明的计数学习框架。实验结果表明,ExplainableFold 可以生成高质量的解释来提供关于氨基酸对蛋白质三维结构影响的几乎实验性理解,进而提高对蛋白质结构的深度理解。
Jan, 2023
该研究基于 AlphaFold DB 建立了一个新的基于图的基准测试 AlphaDesign,并提出了一种使用蛋白质角度作为新特征、使用简化图变换器编码器(SGT)和使用自信蛋白解码器(CPD)来提高精度的新方法 - ADesign。实验表明,此方法比以前的图形模型表现要好得多,均值精度提高了 8%,推断速度比以前快 40 多倍。
Feb, 2022
AlphaFold2 是蛋白质折叠领域的突破性成果,但其实现不包括必要的训练代码。OpenFold 是 AlphaFold 的第一个可训练的公共重新实现。本研究在 OpenFold 的基础上对 AlphaFold 的训练过程进行了全面分析,发现低效的通信和资源开销过大的计算是导致 AlphaFold 训练无法有效扩展的关键因素。我们提出了 ScaleFold,这是一种系统化的训练方法,专门针对这些因素进行了优化。ScaleFold 成功将 AlphaFold 训练扩展到 2080 个 NVIDIA H100 GPU,资源利用率高。在 MLPerf HPC v3.0 基准测试中,ScaleFold 在 7.51 分钟内完成了 OpenFold 基准测试,比基线快了 6 倍。对于从头开始训练 AlphaFold 模型,ScaleFold 的预训练只需 10 小时,比原始 AlphaFold 预训练基线的七天显著提高。
Apr, 2024
本论文提出了 PiFold 具有改进恢复能力的新型残基特征提取器和 PiGNN 层,可一次性生成蛋白质序列。实验结果显示,PiFold 能够快速恢复结构,并且在 CATH 4.2,TS50 和 TS500 上的恢复效果也非常好,是以前方法的 70 倍快。
Sep, 2022
生物蛋白质的功能常依赖于动态结构集合,本研究通过开发一种基于流动的生成建模方法来学习和采样蛋白质的构象空间,利用 AlphaFold 和 ESMFold 等高精度单状态预测器进行改进,获得了名为 AlphaFlow 和 ESMFlow 的蛋白质结构的序列有条件的生成模型。在 PDB 上经过训练和评估时,我们的方法在精确性和多样性方面相比于具有 MSA 子采样的 AlphaFold 更具优势。当进一步在全原子 MD 的集合上进行训练后,我们的方法能够准确捕捉未知蛋白质的构象灵活性、位置分布和高阶集合观测量。此外,我们的方法可以使静态 PDB 结构多样化,并具有比复制的 MD 轨迹更快的收敛时间,展示了其作为昂贵的基于物理的仿真的替代品的潜力。
Feb, 2024
本研究提出了一种新的蛋白质结构预测方法 ——HelixFold-Single,它基于大规模蛋白质语言模型,将原始序列代替同源序列用于学习蛋白质序列的共同进化信息,并结合 AlphaFold2 的关键组件预测蛋白质原子的三维坐标,其在 CASP14 和 CAMEO 数据集中准确度表现良好,同时能够节省大量的计算时间。
Jul, 2022
我们报道了我们的蛋白质复合物结构预测模型 HelixFold-Multimer 的不断改进,强调其卓越的性能。HelixFold-Multimer 在多样的蛋白质复合物结构,特别是治疗蛋白质相互作用方面,提供了精确的预测,尤其在抗原 - 抗体和肽 - 蛋白质结构预测方面超过了 AlphaFold-Multimer 数倍。HelixFold-Multimer 现在可在 PaddleHelix 平台上进行公开使用,提供通用版本和抗原 - 抗体版本,研究人员可以方便地访问和利用此服务满足其开发需求。
Apr, 2024
本文探讨了基于深度学习的 AlphaFold2 方法在蛋白质三级结构预测中的优势,以及对于突变的限制。通过进化方法生成对抗性序列,只修改三个氨基酸残基就能使 AlphaFold2 预测结果相差甚远,同时,该方法也能快速识别关键的氨基酸残基和蛋白质的可能性构象,从而大大加速蛋白质结构的实验过程。
May, 2023