BatGPT-Chem:用于逆合成预测的基础大模型
研究者利用深度神经网络和 Monte Carlo Tree Search 相结合的方法,通过训练为所有有机化学反应提供未来的化合物转化路径,从而加速了药物和材料的发现,并启用完全自动的机器人合成。
Aug, 2017
提出新模型用于反合成预测,在美国专利文献数据集上通过序列到序列及离散潜在变量方法构建预测模型较基准模型性能显著提高同时生成更多多样性化预测结果。
Oct, 2019
本文提出了一种基于图神经网络的模板自由算法,通过将逆向合成分为两个步骤来自动扩展化学反应,识别目标分子的潜在反应中心,生成中间合成物和生成与中间合成物相关的反应物。该方法在性能上超越了现有技术,并提供了合理的化学解释。
Nov, 2020
采用指令工程来指导 ChatGPT 在多样化的科学文献格式和风格中自动化地进行金属有机骨架合成条件的文本挖掘,该方法有效缓解了 ChatGPT 在科学领域中使用大型语言模型困难的问题,从而实现了令人印象深刻的准确性和精度。
Jun, 2023
本文是首篇对计算化学中反应和逆合成预测采用深度学习模型的应用进行综述,从设计机制、优势和弱点等多方面给出了全面系统的调查结论,并提出了当前解决方案的局限性和问题,最后探讨了未来研究的发展方向。
Jun, 2023
化合物的追溯合成涉及将化合物逐步递归地分解为分子前体,直到找到一组商业可获得的分子为止,以提供合成路径。本研究结合了两个主要的研究方向,即单步追溯合成预测模拟化学反应逻辑和多步合成规划试图找到合适的反应序列,发现了高单步表现与寻找合成路线成功之间存在的断裂,并且示范了单步模型对多步合成规划整体成功率的重要影响。
Aug, 2023
近年来,如何综合分子的规划,即背向合成,已成为机器学习和化学领域关注的焦点之一。然而,现有技术存在系统性缺陷,由于缺乏完善的基准和一致的比较方法而被掩盖。为解决这个问题,我们提出了一个名为syntheseus的基准库,以默认方式促进最佳实践,使单步和多步背向合成算法能够进行一致且有意义的评估。我们使用syntheseus对之前的一些背向合成算法进行重新评估,发现在仔细评估时,目前最先进模型的排名会有所改变。最后,我们提供了这一领域未来工作的指导建议。
Oct, 2023
利用预训练文本语言模型(如ChatGPT),我们提出了一个以文本辅助的逆合成预测方法T-Rex,它通过生成目标分子的描述和分子图的结构来生成候选反应中心,并使用候选反应物的描述进行重新排序,从而更好地合成目标分子。通过对两个数据集的实验,我们观察到T-Rex明显优于基于图结构的最先进方法,在不仅使用重新排序步骤的ChatGPT描述的变体中T-Rex也表现出色,这表明我们的框架优于ChatGPT和图信息的简单集成方法。综上所述,我们展示了预训练语言模型生成的文本可以大大提高逆合成预测,为利用ChatGPT推进计算化学开辟了新的途径。
Jan, 2024
该研究提出了一种基于半模板的方法,即RetroSiG框架,用于预测复杂反应,并通过反应中心的识别和离去基团的完善任务来搜索产物分子图和离去基团超图,以此来缓解现有方法中的限制。
Feb, 2024