BatGPT-Chem：用于逆合成预测的基础大模型

Aug, 2024

BatGPT-Chem：用于逆合成预测的基础大模型

BatGPT-Chem: A Foundation Large Model For Retrosynthesis Prediction

Yifei Yang, Runhan Shi, Zuchao Li, Shu Jiang, Bao-Liang Lu...

TL;DR本研究针对药物发现和有机化学中逆合成分析的挑战，提出了一种新颖的BatGPT-Chem大语言模型，具备150亿参数。该模型通过自然语言和SMILES符号的统一框架整合了化学任务，展现了在复杂分子合成策略生成方面的显著进展，能够有效加速新化合物的合成过程。

Abstract

Retrosynthesis analysis is pivotal yet challenging in drug discovery and organic chemistry. Despite the proliferation of computational tools over the past decade, AI-based systems often fall short in generalizing across diverse reaction types and exploring alternative synthetic pathway

发现论文，激发创造

学习规划化学合成

研究者利用深度神经网络和 Monte Carlo Tree Search 相结合的方法，通过训练为所有有机化学反应提供未来的化合物转化路径，从而加速了药物和材料的发现，并启用完全自动的机器人合成。

Aug, 2017

学习制作具有普适性和多样性的回溯合成预测

提出新模型用于反合成预测，在美国专利文献数据集上通过序列到序列及离散潜在变量方法构建预测模型较基准模型性能显著提高同时生成更多多样性化预测结果。

Oct, 2019

一种基于贝叶斯算法的反合成化学方法

使用机器学习技术，采用Bayesian推理和蒙特卡罗搜索算法，逆向发现了合成路线，能够以较高的准确率运用于合成有机化学方面。

Mar, 2020

RetroXpert: 化学家式分解逆合成预测

本文提出了一种基于图神经网络的模板自由算法，通过将逆向合成分为两个步骤来自动扩展化学反应，识别目标分子的潜在反应中心，生成中间合成物和生成与中间合成物相关的反应物。该方法在性能上超越了现有技术，并提供了合理的化学解释。

Nov, 2020

ChatGPT化学助手用于文本挖掘和MOF合成预测

采用指令工程来指导 ChatGPT 在多样化的科学文献格式和风格中自动化地进行金属有机骨架合成条件的文本挖掘，该方法有效缓解了 ChatGPT 在科学领域中使用大型语言模型困难的问题，从而实现了令人印象深刻的准确性和精度。

Jun, 2023

深度学习在反应和追溯合成预测中的统一视图: 现状与未来挑战

本文是首篇对计算化学中反应和逆合成预测采用深度学习模型的应用进行综述，从设计机制、优势和弱点等多方面给出了全面系统的调查结论，并提出了当前解决方案的局限性和问题，最后探讨了未来研究的发展方向。

Jun, 2023

模型的重要性：单步反合成对合成规划的影响

化合物的追溯合成涉及将化合物逐步递归地分解为分子前体，直到找到一组商业可获得的分子为止，以提供合成路径。本研究结合了两个主要的研究方向，即单步追溯合成预测模拟化学反应逻辑和多步合成规划试图找到合适的反应序列，发现了高单步表现与寻找合成路线成功之间存在的断裂，并且示范了单步模型对多步合成规划整体成功率的重要影响。

Aug, 2023

再评估合成路线的算法与Syntheseus

近年来，如何综合分子的规划，即背向合成，已成为机器学习和化学领域关注的焦点之一。然而，现有技术存在系统性缺陷，由于缺乏完善的基准和一致的比较方法而被掩盖。为解决这个问题，我们提出了一个名为syntheseus的基准库，以默认方式促进最佳实践，使单步和多步背向合成算法能够进行一致且有意义的评估。我们使用syntheseus对之前的一些背向合成算法进行重新评估，发现在仔细评估时，目前最先进模型的排名会有所改变。最后，我们提供了这一领域未来工作的指导建议。

Oct, 2023

T-Rex: 文本辅助的合成逆向预测

利用预训练文本语言模型（如ChatGPT），我们提出了一个以文本辅助的逆合成预测方法T-Rex，它通过生成目标分子的描述和分子图的结构来生成候选反应中心，并使用候选反应物的描述进行重新排序，从而更好地合成目标分子。通过对两个数据集的实验，我们观察到T-Rex明显优于基于图结构的最先进方法，在不仅使用重新排序步骤的ChatGPT描述的变体中T-Rex也表现出色，这表明我们的框架优于ChatGPT和图信息的简单集成方法。综上所述，我们展示了预训练语言模型生成的文本可以大大提高逆合成预测，为利用ChatGPT推进计算化学开辟了新的途径。

Jan, 2024

基于(超)图搜索的逆向合成预测

该研究提出了一种基于半模板的方法，即RetroSiG框架，用于预测复杂反应，并通过反应中心的识别和离去基团的完善任务来搜索产物分子图和离去基团超图，以此来缓解现有方法中的限制。

Feb, 2024