基于多模态流匹配的全原子肽设计
基于条件流匹配对环面进行建模的针对靶向感知的肽设计方法 PPFlow 填补了人工智能辅助肽药物发现领域的不足,并通过建立名为 PPBench2024 的蛋白 - 肽结合数据集以填充大规模数据空白,实验证明 PPFlow 在肽药物的生成和优化等任务上具有领先水平的性能,并且可以推广到其他任务,包括对接和侧链装配。
Mar, 2024
利用氨基酸序列的丰富生物归纳偏差,FoldFlow-2 是一种新颖的序列条件的 SE (3)- 等变流匹配模型,用于蛋白质结构生成,并通过在一个比以前的 PDB 数据集大一个数量级的新数据集上进行规模训练,改进了无条件生成的设计能力、多样性和新颖性,同时在平衡构象抽样任务上具有泛化性能。
May, 2024
FoldFlow 是一系列基于流匹配范式的新型生成模型,通过流动匹配 3D 刚体运动(即群 SE (3)),实现对蛋白质主链的准确建模,具备比其他方法更稳定、更快速的训练能力,并可以将任何不变的源分布映射到 SE (3) 上的任何不变的目标分布。
Oct, 2023
本研究提出了一种多模态对比扩散模型(MMCD),将序列和结构两种模态在扩散框架中融合,旨在共同生成新的多肽序列和结构。MMCD 通过构建序列模态和结构模态的扩散模型,并在每个扩散步骤中采用多模态对比学习策略,通过交叉对比和内部对比来捕捉两种模态之间的一致性,提高模型性能。广泛的实验表明,MMCD 在生成治疗性肽段方面优于其他最先进的深度生成方法,包括抗菌 / 抗癌评分、多样性和肽段对接等多个指标。
Dec, 2023
通过引入可伸缩的 E (3)- 等变消息传递体系结构 Semla 和使用流匹配训练的分子生成模型 MolFlow,本研究解决了当前 3D 药物设计中的慢速采样和生成化学有效分子的问题,并且提出了用于无条件分子生成器的新的基准度量方法,最终实验结果表明 MolFlow 显著提升了样本质量和性能。
Jun, 2024
蛋白质设计中,基于模体的脚手架技术用于构建功能性蛋白质,但生成的脚手架缺乏结构多样性,限制了湿实验验证的成功。本研究通过两种互补方法,在使用 FrameFlow 进行脚手架设计时实现了较高成功率和更多结构多样性的脚手架生成。
Jan, 2024
MMDesign 是一个结合了先前结构模块和语境模块的预训练模型的新型蛋白质设计范式,利用自编码器(AE)语言模型将蛋白质序列的先验语义知识纳入其中,并引入了一种跨层跨模态对齐算法来确保结构模块学习到长期时间信息并保持结构和语境模态的一致性,在仅使用小规模 CATH 数据集进行训练的实验结果表明,我们的 MMDesign 框架在各种公共测试集上始终优于其他基线方法,并提出了系统性定量分析技术来评估生成的蛋白质序列和数据分布的生物可能性,以展示其可解释性并揭示蛋白质设计的规律。
Dec, 2023
该论文介绍了利用 HarmonicFlow 和 FlowSite 两种改进的生成过程,通过结构建模和流匹配目标来提高蛋白质结合小分子的生成过程,并展示了其在蛋白质结合位点设计中的应用优势。
Oct, 2023
本研究提出了一种新颖的生物模态转换器,通过学习残余联系的界面联合分布来预测蛋白质 - 肽相互作用,并采用来自 PepBDB 和 PDB 的伪蛋白质 - 肽复合物的扩充数据集实现数据扩充,使用神经网络进行训练以代替模板建模方法,从而增加了模型的预测能力。
May, 2023
该研究介绍了一种新颖的多视角对比学习框架 PepHarmony,用于序列化的肽编码任务,它创新性地将序列和结构级别信息结合到序列级编码模块中,并通过对比学习捕捉了肽序列和结构之间的复杂关系。此框架对于肽表示具有显著的能力,并为肽药物发现和肽工程的未来应用提供了有价值的见解。
Jan, 2024