ChemGrapher：基于深度学习的化学化合物光学图形识别

Feb, 2020

ChemGrapher：基于深度学习的化学化合物光学图形识别

ChemGrapher: Optical Graph Recognition of Chemical Compounds by Deep Learning

Martijn Oldenhof, Adam Arany, Yves Moreau, Jaak Simm

TL;DR本研究利用机器学习中的深度神经网络模型对化学图像进行自动识别和转化，以解决传统工具在检测链的多样性及立体化学信息时产生的错误和丢失原子等问题，并能迅速处理大量图像，从而在药物发现等方面具有重要应用价值。

Abstract

In drug discovery, knowledge of the graph structure of chemical compounds is essential. Many thousands of scientific articles in chemistry and pharmaceutical sciences have investigated →

drug discovery chemical compounds machine learning deep neural network error reduction

发现论文，激发创造

MolGrapher 化学结构的基于图的可视化识别

该研究提出了 MolGrapher 方法，通过视觉识别化学结构，构建分子的自然图形表示，并利用图神经网络分类分子中的原子和键节点。实验证明该方法在大多数情况下明显优于传统和基于学习的方法，可用于加快新材料和药物的发现。

Aug, 2023

有限监督的原子级光学化学结构识别

通过图形表示或图像识别分子的化学结构是一项具有挑战性的模式识别任务，在药物开发方面具有很大的好处。我们提出了一种新的化学结构识别工具，该工具提供了最先进的性能，并可以适应少量数据样本和监督下的新领域。与以前的方法不同，我们的方法提供了原子级定位，因此可以将图像分割成不同的原子和键。我们的模型是第一个只使用 SMILES 监督进行原子级实体检测的 OCSR 模型。通过严格和广泛的基准测试，我们证明了我们的化学结构识别方法在数据效率、准确性和原子级实体预测方面的卓越性。

Apr, 2024

MolScribe：基于图像生成的鲁棒分子结构识别

本文介绍了一个新颖的图像转化成图形结构的模型 MolScribe，该模型灵活地融合了象征性化学限制条件，扩展了简略结构，通过数据扩充策略，提高了模型鲁棒性。在合成和逼真的分子图像上的实验中，MolScribe 显著优于之前的模型，在公共基准测试中实现了 76-93％的准确性。化学家还可以通过模型的置信度估计和原子级对齐来轻松验证 MolScribe 的预测。

May, 2022

用于高通量聚合物筛选的信息传递神经网络

研究表明，基于分子结构的图神经网络架构是目前预测分子性质最好的机器学习方法之一，并且可以监督大规模重复评估化合物库。使用新的有机光伏应用候选分子数据库进行的实验证明，即使不要求最优的立体结构输入，利用信息传递神经网络可以获得与现有基准数据集上最先进方法相媲美的准确性。

Jul, 2018

利用多种分子图表示增强化合物性质和活性预测中的模型学习和解释

本研究提出了多种分子图表示法，探究了它们对模型学习和解释的影响，结果显示将原子图表示和减少的分子图表示相结合可以产生具有前途的模型性能。此外，解释结果可以提供与背景知识一致的重要功能和潜在子结构。这些多个分子图表示和解释分析可以提高模型理解，并促进药物发现相关应用。

Apr, 2023

基于图像和图结构的多模态学习用于预测分子性质的框架

MolIG 是一种多模态分子预训练框架，通过图像和图结构创新地利用分子图和分子图像之间的一致性和相关性执行自监督任务，有效地将两种分子表示形式的优势融合在一起，这种整体方法能够捕捉关键的分子结构特征和高层次的语义信息，并在分子拓展组和 ADMET 拓展组等基准组中，相对于先进的基线模型展现出在分子性质预测等拓展任务中性能的提升。

Nov, 2023

分层图到图分子翻译

本文重点研究了药物发现方面的自动优化工具，并且提出了一种基于图像及其翻译方法的分子优化技术，利用其原子级编码和自回归图形解码器解决分子结构中的多个技术挑战。同时，我们的模型在多项任务中显著优于现有的基准模型。

Jun, 2019

交互式生物分子系统的图表示学习

本文综述了用于表示生物分子和系统的计算机可识别对象的方法学，特别是强调基于图形技术的几何深度学习模型如何分析生物分子数据以实现药物发现，蛋白质表征和生物系统分析，最终总结了该领域的当前状况以及存在的挑战和未来研究方向。

Apr, 2023

分析学习的分子表征进行性质预测

在分子属性预测的算法解决方案中，神经机器技术的进步导致了一系列算法解决方案，其中神经网络应用于计算分子指纹或专家制作的描述符以及构造学习分子表示的图卷积神经网络最为有效，这项研究进行了广泛的基准测试，并提出了优于现有模型的图卷积模型的实证发现。

Apr, 2019

药物设计的分子生成：基于图学习的视角

综述了机器学习和图学习在分子设计和药物发现中的应用，提出将这些方法分成三类，并总结了常用的评估指标和公共数据集。最后，从药品视角探讨了未来研究的挑战和方向。

Feb, 2022