ChemGrapher:基于深度学习的化学化合物光学图形识别
该研究提出了 MolGrapher 方法,通过视觉识别化学结构,构建分子的自然图形表示,并利用图神经网络分类分子中的原子和键节点。实验证明该方法在大多数情况下明显优于传统和基于学习的方法,可用于加快新材料和药物的发现。
Aug, 2023
通过图形表示或图像识别分子的化学结构是一项具有挑战性的模式识别任务,在药物开发方面具有很大的好处。我们提出了一种新的化学结构识别工具,该工具提供了最先进的性能,并可以适应少量数据样本和监督下的新领域。与以前的方法不同,我们的方法提供了原子级定位,因此可以将图像分割成不同的原子和键。我们的模型是第一个只使用 SMILES 监督进行原子级实体检测的 OCSR 模型。通过严格和广泛的基准测试,我们证明了我们的化学结构识别方法在数据效率、准确性和原子级实体预测方面的卓越性。
Apr, 2024
本文介绍了一个新颖的图像转化成图形结构的模型 MolScribe,该模型灵活地融合了象征性化学限制条件,扩展了简略结构,通过数据扩充策略,提高了模型鲁棒性。在合成和逼真的分子图像上的实验中,MolScribe 显著优于之前的模型,在公共基准测试中实现了 76-93%的准确性。化学家还可以通过模型的置信度估计和原子级对齐来轻松验证 MolScribe 的预测。
May, 2022
研究表明,基于分子结构的图神经网络架构是目前预测分子性质最好的机器学习方法之一,并且可以监督大规模重复评估化合物库。使用新的有机光伏应用候选分子数据库进行的实验证明,即使不要求最优的立体结构输入,利用信息传递神经网络可以获得与现有基准数据集上最先进方法相媲美的准确性。
Jul, 2018
本研究提出了多种分子图表示法,探究了它们对模型学习和解释的影响,结果显示将原子图表示和减少的分子图表示相结合可以产生具有前途的模型性能。 此外,解释结果可以提供与背景知识一致的重要功能和潜在子结构。这些多个分子图表示和解释分析可以提高模型理解,并促进药物发现相关应用。
Apr, 2023
MolIG 是一种多模态分子预训练框架,通过图像和图结构创新地利用分子图和分子图像之间的一致性和相关性执行自监督任务,有效地将两种分子表示形式的优势融合在一起,这种整体方法能够捕捉关键的分子结构特征和高层次的语义信息,并在分子拓展组和 ADMET 拓展组等基准组中,相对于先进的基线模型展现出在分子性质预测等拓展任务中性能的提升。
Nov, 2023
本文重点研究了药物发现方面的自动优化工具,并且提出了一种基于图像及其翻译方法的分子优化技术,利用其原子级编码和自回归图形解码器解决分子结构中的多个技术挑战。同时,我们的模型在多项任务中显著优于现有的基准模型。
Jun, 2019
本文综述了用于表示生物分子和系统的计算机可识别对象的方法学,特别是强调基于图形技术的几何深度学习模型如何分析生物分子数据以实现药物发现,蛋白质表征和生物系统分析,最终总结了该领域的当前状况以及存在的挑战和未来研究方向。
Apr, 2023
在分子属性预测的算法解决方案中,神经机器技术的进步导致了一系列算法解决方案,其中神经网络应用于计算分子指纹或专家制作的描述符以及构造学习分子表示的图卷积神经网络最为有效,这项研究进行了广泛的基准测试,并提出了优于现有模型的图卷积模型的实证发现。
Apr, 2019
综述了机器学习和图学习在分子设计和药物发现中的应用,提出将这些方法分成三类,并总结了常用的评估指标和公共数据集。最后,从药品视角探讨了未来研究的挑战和方向。
Feb, 2022