Anfinsen Goes Neural: 一种基于图模型的条件抗体设计
本文提出了一种基于生成模型的方法来自动设计具有增强的结合特异性或中和能力的抗体的 CDRs。该方法系统地利用了序列和三维结构之间的关系,并在设计中具有更高的效率和灵活性,最终成功设计出能够中和 SARS-CoV-2 病毒的抗体。
Oct, 2021
利用基于语言模型的灵活深度学习策略,基于一个完全基于提示的模型,将 transformer 和图卷积架构集成到因果多头图机制中,实现一个生成预训练模型,用于预测蛋白质的二级结构内容、蛋白质可溶性和蛋白质测序等任务,并可用于设计具有这些特性的蛋白质,这个模型展现了多任务和协同作用的应用价值。
May, 2023
本文提出了一种利用图神经网络和自然语言大模型生成结构和序列感知型蛋白质表示的新框架,并将其与传统的基于结构对齐的方法相比较,证明了该方法在比较蛋白质结构和蛋白质结构分类任务中的优越性能。
Jun, 2023
该研究总结了在蛋白质研究中使用语言模型的应用,包括设计新型人工蛋白质、使用非 Transformer 结构以及应用于定向进化方面。这些成果已经快速提升了蛋白质研究的发展和性能。
May, 2023
本研究提出了一种结构感知交互图神经网络 (SIGN),用于预测蛋白质 - 配体复合物的亲和力。SIGN 包含极性启发式图注意力层(PGAL)和配对交互池(PiPool)两个部分,能充分利用生物分子结构信息并考虑原子之间的长程相互作用,在两个基准测试中显示其优越性。
Jul, 2021
通过训练两个自回归模型和四个自编码器模型,使用生物信息数据培训出来的语言模型(Language Models)能够在低推断开销下完成新的前沿预测,例如使用蛋白 LM - 嵌入 (ProtT5) 能够在无需使用进化信息的情况下,成功地进行氨基酸序列每残基预测,并出现在这个 https URL。
Jul, 2020
我们提出了一种称为 Ankh 的通用蛋白质语言模型(PLM),首次在 Google 的 TPU-v4 上进行训练,并在参数更少的情况下超越了最先进的性能,能够学习蛋白质的进化保守突变趋势,同时保留关键的结构 - 功能特征。
Jan, 2023
使用 Generative Adversarial Policy Network(GAPN)通过策略梯度优化的领域特定奖励和对抗性损失来自动预测多链蛋白质复合物的结构,相较于最先进的 PCM 软件,GAPN 在 TM-Score 方面提升了 27%,速度提升了 600 倍。
Mar, 2024
提出了一种将概率图模型和深度学习相结合的模型框架,通过将神经网络用于观测模型,提高了潜在变量的图形结构;针对推断,使用了可视化的自编码器,利用识别网络输出共轭潜力的图形模型近似分布;所有的这些模型组件都是同时学习的,从而得到了一种可扩展的算法,利用了随机变分推断、自然梯度、图形模型信息传递和重参数化技巧。此模型框架的示例模型和应用程序向小鼠行为表型学方法提出了有效的解决方案。
Mar, 2016
本文介绍一种利用图形神经网络(GNN)的自动化方法,通过结合来自冷冻电子显微镜(cryo-EM)数据和氨基酸序列数据以及对蛋白质几何的先验知识,对蛋白质原子模型的自动构建进行改进,并对 28 个测试案例进行了验证。结果表明,在分辨率优于 3.5 Å 的 cryo-EM 图中,我们的方法优于现有技术,并且接近于手动构建。
Sep, 2022