MAS2HP: 一个在 2D HP 模型中预测蛋白质结构的多智能体系统
本文系统地概述了蛋白质语言模型在蛋白质结构预测中的应用和方法,介绍了网络架构、预训练策略、常用蛋白质数据库等方面的最新进展和挑战,并展望了未来发展方向。
Nov, 2022
MSAGPT 是一种新颖的方法,通过在低 MSA 水平下进行 MSA 生成预训练来促进蛋白质结构预测,其通过简单而有效的 2D 进化位置编码方案来建模复杂的进化模式,并通过 AlphaFold2 的反馈进一步增强模型能力,证实了 MSAGPT 在生成忠实的虚拟 MSA 以提高结构预测准确性方面的功效,并突显了其促进其他蛋白质任务的巨大潜力。
Jun, 2024
该研究利用语言生成模型 MSA-Augmenter 及大规模 MSA 技术,微调 AlphaFold2 蛋白质结构预测模型在缺乏同源家族数据库的情况下,生成补充性的未见过的蛋白质序列,从而提高蛋白质结构预测准确性。
Jun, 2023
预测蛋白质的配体结合位点对于理解蛋白质功能和筛选潜在药物是一项基础而重要的任务。通过使用蛋白序列和配体分子图作为输入,LaMPSite 模型能够在没有 3D 蛋白质结构信息的情况下预测结合位点,与需要 3D 结构的基准方法相比具有竞争力的性能,这为药物发现提供了新的机会。
Dec, 2023
基于大语言模型 (LLMs) 的 ProtAgents 平台引入多个具有不同能力的 AI 智能体,通过动态环境下的协同工作,致力于解决多目标的蛋白质设计与分析问题,展示了 LLMs 在材料领域中发挥的潜力,并为自主材料发现与设计开辟了新的途径。
Jan, 2024
本研究提出了一种新的蛋白质结构预测方法 ——HelixFold-Single,它基于大规模蛋白质语言模型,将原始序列代替同源序列用于学习蛋白质序列的共同进化信息,并结合 AlphaFold2 的关键组件预测蛋白质原子的三维坐标,其在 CASP14 和 CAMEO 数据集中准确度表现良好,同时能够节省大量的计算时间。
Jul, 2022
本文中,我们介绍了一种基于自我监督知识的低同源蛋白质次级结构预测方法,利用残基分布、BERT 特征和残基 - 注意力相融合技术,避免了特征输入不足和噪声扰动问题,此方法在 BC40 数据集中对极低同源情况下具有显著的预测效果。
Aug, 2021
本研究使用 ESM2 最先进的蛋白质语言模型,并结合蛋白质家族分类和基于社区传播的聚类算法,改善了全局蛋白质表示和局部氨基酸准确性,从而大幅提升蛋白质表达质量,并在多个下游实验中取得了最先进的结果。
Apr, 2024
通过研究,我们发现当利用 AI 工具(如 AlphaFold2)预测的蛋白质结构时,现有的方法在预测准确性上存在明显的下降,我们将该现象归因于结构表示学习的结构嵌入偏差。为了解决这个问题,我们提出了一种蛋白质结构嵌入对齐优化框架(SAO),并确定了一个稳健蛋白质性质预测的蛋白质三维图结构学习问题(PGSL-RP3),通过大量实验证明了我们的框架在改进预测结构和实验结构的性质预测方面既适用于各种模型,又有效果。
Oct, 2023
通过深度强化学习训练的 FoldingZero 框架能够自行折叠出一个 2D HP 结构的蛋白质,学习到了隐藏的折叠知识,是一个在蛋白质折叠领域有应用潜力的新方法。
Dec, 2018