Jun, 2024

BindGPT:基于语言建模和强化学习的可扩展三维分子设计框架

TL;DR通过使用一种概念简单但强大的方法,在给定蛋白质的结合位点内创建 3D 分子,我们展示了一个新颖的生成模型 BindGPT。我们的模型能够联合生成分子图和构象,消除了额外的图重建步骤。我们将 BindGPT 在大规模数据集上进行预训练,并使用来自外部模拟软件的评分进行强化学习的微调。我们演示了单个预训练语言模型可同时作为 3D 分子生成模型、以分子图为条件的构象生成器和以口袋为条件的 3D 分子生成器。值得注意的是,该模型对于生成的域没有任何等价性假设。我们展示了这种简单的概念方法结合预训练和扩展能够与当前最佳的专门扩散模型、语言模型和图神经网络相媲美或更优,而采样的成本却降低了两个数量级。