May, 2024

DirectMultiStep: 多步反应合成的直接路线生成

TL;DR传统计算辅助合成规划方法依赖于迭代单步预测,导致搜索空间呈指数增长,限制了效率和可扩展性。我们引入了一种基于 Transformer 模型的方法,通过有条件地基于所有前面的分子来预测每个分子,直接生成多步合成路线作为一个字符串。该模型适应了特定条件,如期望的步数和起始物质,在 PaRoutes 数据集上的表现优于现有方法,在 n$_1$ 测试集上的 Top-1 准确率提高了 2.2 倍,在 n$_5$ 测试集上提高了 3.3 倍。它还成功预测了训练数据中未包含的 FDA 批准药物的路线,展示了其泛化能力。尽管当前训练集的亚优多样性可能会影响对于不常见反应类型的性能,但我们的方法在实现全自动逆向合成规划方面显示了一个有希望的方向。