无模板模型的自动逆向合成路径规划
通过使用 Transformer 神经网络架构的自校正回溯合成预测器 (SCROP),我们将回溯合成规划转化为反应物和产物的分子线性符号之间的机器翻译问题,并结合基于神经网络的语法校正器,在标准基准数据集上实现了 59% 的准确性,比其他深度学习方法提高了 21% 以上,比基于模板的方法提高了 6% 以上。最重要的是,对于训练集中未出现的化合物,我们方法的准确性比其他最先进的方法提高了 1.7 倍。
Jul, 2019
传统计算辅助合成规划方法依赖于迭代单步预测,导致搜索空间呈指数增长,限制了效率和可扩展性。我们引入了一种基于 Transformer 模型的方法,通过有条件地基于所有前面的分子来预测每个分子,直接生成多步合成路线作为一个字符串。该模型适应了特定条件,如期望的步数和起始物质,在 PaRoutes 数据集上的表现优于现有方法,在 n$_1$ 测试集上的 Top-1 准确率提高了 2.2 倍,在 n$_5$ 测试集上提高了 3.3 倍。它还成功预测了训练数据中未包含的 FDA 批准药物的路线,展示了其泛化能力。尽管当前训练集的亚优多样性可能会影响对于不常见反应类型的性能,但我们的方法在实现全自动逆向合成规划方面显示了一个有希望的方向。
May, 2024
提出一种以深度神经网络为基础的框架,应对合成目标分子时所需考虑的现实反应和可行建筑基元,以及优化生成的反应路径,实验结果显示该方法提高了反应路径的解决成功率。
Jun, 2021
本文介绍了 UAlign,一种无模板的图序列化逆合成预测方法,通过结合图神经网络和 Transformer,更有效地利用了分子的内在图结构。基于化学反应过程中大部分分子结构保持不变的事实,我们提出了一种简单而有效的 SMILES 对齐技术,以促进未改变结构在反应物生成中的重复利用。大量实验表明,我们的方法明显优于最先进的无模板和半模板方法。重要的是,我们的无模板方法在效果上可与甚至超过已建立的强大的模板方法相媲美。
Mar, 2024
提出了一种基于树 - 序列转换器模型和 SMILES 语法树的复合模型 - G-MATT,该模型创新性地结合了数据驱动模型和化学知识,能够显著改善传统预测指标,并在保留了化学知识的同时避免了过于复杂的模型架构。
May, 2023
本论文讲述了一种完全基于数据驱动的模型,该模型学习执行一个反合成反应预测任务,将其作为序列到序列映射问题来处理。该模型为端到端的训练模型,具有编码器 - 解码器结构,包含两个递归神经网络,该模型通过对美国专利文献中的 50,000 个实验反应示例进行训练,拥有解决计算机反应分析的挑战性问题的重要前进一步。
Jun, 2017
研究者利用深度神经网络和 Monte Carlo Tree Search 相结合的方法,通过训练为所有有机化学反应提供未来的化合物转化路径,从而加速了药物和材料的发现,并启用完全自动的机器人合成。
Aug, 2017
本文提出了一种名为 MCTS 的基于模拟退火算法的反合成规划方法,使用 Experience Guidance Network 从化学合成经验中学习知识,实现有效处理拥有巨大可能性的化学反应,实验结果证明在效率和功效上均优于现有研究成果。
Dec, 2021
本文提出了一种基于神经网络的 A * 算法 Retro * 来高效地进行合成路径规划,在美国专利和商标局数据集上实验表明,我们的方法不仅成功率和解决方案质量均优于现有技术,而且效率更高。
Jun, 2020
分子逆合成是一个重要且复杂的化学问题,传统的手动合成方法不仅需要训练有素的专家,而且耗时,随着大数据和机器学习的发展,基于人工智能的逆合成引起了越来越多的关注,成为分子逆合成的有价值工具。我们提出了一种基于进化优化的逆合成路线规划的新方法,标志着进化算法在多步逆合成领域的首次应用。实验结果显示,相比于蒙特卡罗树搜索算法,进化优化算法显著减少了单步模型调用数量的平均值 53.9%,搜索三个解所需的时间平均减少了 83.9%,可行搜索路径数量增加了 5 倍。
Oct, 2023