基于模型的蛋白质骨架设计的强化学习

May, 2024

基于模型的蛋白质骨架设计的强化学习

Model-based reinforcement learning for protein backbone design

Frederic Renard, Cyprien Courtot, Alfredo Reichlin, Oliver Bent

TL;DR利用 AlphaZero 在蛋白质主链设计中的应用，展示了其出色的性能，不仅显著超越了现有方法，在蛋白质主链设计任务中提高了 100% 以上，而且通过引入次要目标，还揭示了更多有前景的结果，显示了模型驱动的强化学习在蛋白质设计的精确和微妙方面的潜力。

Abstract

Designing protein nanomaterials of predefined shape and characteristics has the potential to dramatically impact the medical industry. machine learning (ML) has proven successful in →

protein nanomaterials machine learning protein design alphazero reinforcement learning

发现论文，激发创造

通过强化学习进行基于蛋白质靶点特异性支架抑制剂的设计

本文提出了一种新颖的框架，名为 3D-MolGNN$_{RL}$，结合了强化学习和基于 3D 骨架的深层生成模型，在优化多个特征的同时，通过并行图神经网络模型自动构建具有特定蛋白质活性的靶向分子，以使药物研发中的分子设计更快更高效。

May, 2022

利用蛋白质语言模型进行序列设计的强化学习

蛋白质序列设计对于药物研发中的蛋白质工程问题至关重要，本研究提出使用蛋白质语言模型作为奖励函数来生成新的序列，利用强化学习和最优化方法进行体系建模，实验证明强化学习在生物序列设计方面具有很大潜力。

Jul, 2024

基于强化学习的可扩展基于碎片的三维分子设计

本文提出了一种基于强化学习框架的分层代理方法，能够在三维空间中逐步放置分子亚结构，从而高效地学习如何建造具有不同分布的分子，包括药物样分子、有机发光二极管分子和生物分子，只利用能量考虑即可。

Feb, 2022

强化学习在以量子力学为导向的分子设计中的应用

本文提出了一种新颖的基于强化学习的分子设计方式，使用笛卡尔坐标系来扩展分子结构类型，并利用快速量子化学方法对基本物理性质（如能量）进行直接奖励函数的构建。同时，引入了名为 MolGym 的强化学习环境，在该环境中针对多种具有挑战性的分子设计任务成功展开实验，并在此基础上，构建出一种翻译及旋转不变的状态空间，实现了从零开始的高效学习。

Feb, 2020

ProtAgents: 基于大型语言模型的物理与机器学习结合的蛋白质发现

基于大语言模型 (LLMs) 的 ProtAgents 平台引入多个具有不同能力的 AI 智能体，通过动态环境下的协同工作，致力于解决多目标的蛋白质设计与分析问题，展示了 LLMs 在材料领域中发挥的潜力，并为自主材料发现与设计开辟了新的途径。

Jan, 2024

在潜空间中使用强化学习进行蛋白质适应性景观的稳健优化

蛋白质是在自然界中负责不同功能的复杂分子。通过使用计算方法进行蛋白质优化仍然具有挑战性，特别是在低适应性序列的情况下。本文提出了一种名为 LatProtRL 的优化方法，它能够有效地遍历由大型蛋白质语言模型学习的潜在空间，通过强化学习在潜在空间中直接建模为马尔可夫决策过程以避免局部最优解。通过在两个重要的适应性优化任务上评估我们的方法，结果表明它能够达到与基线方法相当或更优的适应性。我们的发现和体外评估表明生成的序列可以达到高适应性区域，暗示了 LatProtRL 在实验室控制环路场景中具有巨大的潜力。

May, 2024

FoldingZero: 水疏水模型下的蛋白质折叠

通过深度强化学习训练的 FoldingZero 框架能够自行折叠出一个 2D HP 结构的蛋白质，学习到了隐藏的折叠知识，是一个在蛋白质折叠领域有应用潜力的新方法。

Dec, 2018

深度学习神经网络在蛋白质计算设计中的应用

本文探究将深度学习神经网络应用于蛋白质设计，以预测蛋白质中每个残基上 20 种天然氨基酸的几率，并且以网络输出为残基类型约束，顺利提高 Rosetta 工具设计三种天然蛋白质的平均序列一致性，同时相比早期方法，本研究以多层神经网络构建的方法在序列一致性方面提高了约 3% 的准确率，这些结果将推动计算蛋白质设计方法的进一步发展。

Jan, 2018

功能几何指导的蛋白质序列和骨架结构联合设计

设计合理的蛋白质序列和结构是至关重要的，我们提出了一种基于功能位点的 NAEPro 模型，该模型通过网络注意力和等变层来联合设计蛋白质序列和结构，在两个层次上进行有效而经济的信息传递，实验证明该模型能够设计出与自然蛋白质序列和结构非常相似且具有高度效能的蛋白质。

Oct, 2023

利用进化抽样改进基于少样本学习的蛋白质工程

本文提出一种少样本学习的方法来设计新的功能性蛋白质，该方法包括半监督迁移学习生成离散可行解空间和新型进化蒙特卡罗马尔可夫链采样算法更高效地探索可行解空间。我们在实验中展示了该方法设计出的高适应度基因激活剂有着比现有方法显著的命中率提升，且该方法可以轻松应用在其他蛋白质工程和设计问题中。

May, 2023