面向性质指导的抗体设计的 AntiBARTy 扩散
本文介绍一种名为 AntiBERTy 的语言模型,该模型基于 558M 个天然抗体序列进行训练,在免疫库中对抗体进行聚类,用于理解免疫应答的亲和力成熟的过程,针对高度冗余的序列进行多实例学习,以确定免疫库中关键的结合残基。该方法的进一步发展将能够仅从免疫库序列中提供新的抗原结合洞察。
Dec, 2021
过去 40 年来,治疗抗体的发现和开发已经变得司空见惯。然而,随着治疗抗体构造变得更复杂(例如多样性抗体),常规的优化方法日益低效。机器学习承诺开辟一条使用较少实验和成本的计算模拟路径来加速药物产品的发现和开发。本文对当前的做法进行了批判性评论,解释了常见陷阱,并明确了一组方法开发和评估指南,可应用于治疗抗体发现与开发的不同类型的机器学习技术。
Dec, 2023
本文提出了一种基于预训练模型的计算抗体设计方法,通过对抗体序列数据的预先训练,结合一种一次性的序列 - 结构生成方法和精心设计的模块,成功地生成了具有高性能的抗原特异性抗体。
Oct, 2022
AbDiffuser 是一种依对称性且物理信息感知的扩散模型,用于联合生成抗体的三维结构和序列。它基于蛋白质结构的新表示法,依赖于新颖的对齐蛋白质架构,并利用强扩散先验知识来改进去噪过程。我们的方法借助领域知识和物理约束来改善蛋白质扩散,并能处理序列长度改变,同时将内存复杂度降低一个量级,使得骨架和侧链生成成为可能。我们通过理论和实验验证了 AbDiffuser 的有效性,数值实验展示了 AbDiffuser 生成抗体序列和结构属性与参考集密切相似。实验室实验证实了发现的 16 种 HER2 抗体均具有高表达,且 57.1% 的设计是紧密结合物。
Jul, 2023
我们提出了 IgBert 和 IgT5,这两个迄今为止最好的抗体特异性语言模型,在设计更好的治疗方法方面,能持续处理成对和不成对的变量区域序列作为输入,并且在抗体工程的多样化设计和回归任务上,这些模型胜过了现有的抗体和蛋白质语言模型。这一进展在利用机器学习、大规模数据集和高性能计算增强抗体治疗方法的设计方面迈出了重要的一步。
Mar, 2024
通过使用预先训练的条件扩散模型和等变神经网络,我们提出了直接基于能量偏好优化的方法来指导特定抗原的抗体生成,以获得具有合理结构和显著结合亲和力的抗体设计,实验证明了我们方法在优化抗体能量和提高结合亲和力方面的卓越性能。
Mar, 2024
我们引入了 IgDiff,这是一种基于一般蛋白质骨架扩散框架的抗体可变域扩散模型,扩展到处理多条链。我们评估了我们模型生成的结构的可设计性和新颖性,发现 IgDiff 产生出高度可设计的抗体,其中包含了新颖的结合区域。抽样结构的骨干二面角与参考抗体分布显示出良好的一致性。我们实验证实了这些设计的抗体,并发现全部高产。最后,我们将我们的模型与最先进的生成性骨架扩散模型在一系列抗体设计任务中进行了比较,例如互补决定区的设计或将轻链配对到现有重链上,并展示了改进的特性和可设计性。
May, 2024
抗体、机器学习、免疫治疗设计、抗原表位预测以及蛋白质结构是这篇文章所讨论的关键词和主要研究领域,文章评估了常用的数据来源、评价指标和方法可用性,并全面评估了它们的重要性和局限性,讨论了未来的主要挑战。
Sep, 2023
通过整合力场能量反馈,在扩散模型的采样过程中引入力的引导,我们的模型 DiffForce 能够生成具有较低能量的 CDRs,提升生成抗体的结构和序列。
Jun, 2024
本文探讨了预训练语言模型在不同抗体任务中的表现,以及持续引入生物机制是否有助于模型。我们提供了 Antibody Understanding Evaluation(ATUE)基准,并通过实证研究全面评估了蛋白质预训练语言模型的性能,以得出结论和新见解,这对于药物发现和免疫过程的理解都有实际应用。
Jan, 2023