MolNexTR: 分子图像识别的广义深度学习模型

Mar, 2024

MolNexTR: 分子图像识别的广义深度学习模型

MolNexTR: A Generalized Deep Learning Model for Molecular Image Recognition

Yufan Chen, Ching Ting Leung, Yong Huang, Jianwei Sun, Hao Chen...

TL;DRMolNexTR是一种新型的图像到图形模型，结合了独特的双流编码器来提取复杂的分子图像特征，并结合化学规则预测原子和键的同时理解原子和键的布局规则。此外，它采用一系列新颖的增强算法显著提高了模型的鲁棒性和性能。

Abstract

In the field of chemical structure recognition, the task of converting molecular images into graph structures and SMILES string stands as a significant challenge, primarily due to the varied drawing styles and conventions prevalent in chemical literature. To bridge this gap, we propose

发现论文，激发创造

CheMixNet:使用多种分子表征的混合DNN架构预测化学性质

本文提出了一种基于SMILES和分子指纹的混合特征的神经网络模型CheMixNet，其用于预测化学物质的性质，与其他候选神经网络体系结构相比取得了更好的效果。

Nov, 2018

ChemGrapher：基于深度学习的化学化合物光学图形识别

本研究利用机器学习中的深度神经网络模型对化学图像进行自动识别和转化，以解决传统工具在检测链的多样性及立体化学信息时产生的错误和丢失原子等问题，并能迅速处理大量图像，从而在药物发现等方面具有重要应用价值。

Feb, 2020

通过图神经网络进行分子对比学习表示

本文介绍了 MolCLR 框架：通过图神经网络的分子对比学习，基于大规模未标记的分子数据集学习不同iable的表征，提供预训练和微调来有效地预测分子性质，实验结果显示该框架在分类和回归任务上显着提高了性能。

Feb, 2021

MolNet: 预测分子属性的化学直觉图神经网络

该研究提出了一种基于MolNet的图神经网络（GNN）模型来获取三维分子的物理化学特性及其非化学键信息，同时该模型在BACE和ESOL数据集的分类和回归任务上皆表现出良好的性能。

Feb, 2022

MolScribe：基于图像生成的鲁棒分子结构识别

本文介绍了一个新颖的图像转化成图形结构的模型MolScribe，该模型灵活地融合了象征性化学限制条件，扩展了简略结构，通过数据扩充策略，提高了模型鲁棒性。在合成和逼真的分子图像上的实验中，MolScribe显著优于之前的模型，在公共基准测试中实现了76-93％的准确性。化学家还可以通过模型的置信度估计和原子级对齐来轻松验证MolScribe的预测。

May, 2022

分子几何深度学习

本文提出了一种新颖的、基于分子图像而非化学键的分子表示方法，并称其可以实现相似或更好的分子属性预测结果，表明其拥有超越共价键分子图像的潜力。同时，基于上述发现，本文提出了分子几何深度学习（Mol-GDL）模型，并在14个常用基准数据集上进行了测试，结果表明该模型的效果优于现有的最先进方法。

Jun, 2023

MolGrapher化学结构的基于图的可视化识别

该研究提出了MolGrapher方法，通过视觉识别化学结构，构建分子的自然图形表示，并利用图神经网络分类分子中的原子和键节点。实验证明该方法在大多数情况下明显优于传统和基于学习的方法，可用于加快新材料和药物的发现。

Aug, 2023

基于图像和图结构的多模态学习用于预测分子性质的框架

MolIG是一种多模态分子预训练框架，通过图像和图结构创新地利用分子图和分子图像之间的一致性和相关性执行自监督任务，有效地将两种分子表示形式的优势融合在一起，这种整体方法能够捕捉关键的分子结构特征和高层次的语义信息，并在分子拓展组和ADMET拓展组等基准组中，相对于先进的基线模型展现出在分子性质预测等拓展任务中性能的提升。

Nov, 2023

利用GPT-4V进行网孔化学中的图像和数据挖掘

该研究展示了GPT-4V的卓越能力，在金属有机框架方面的搜索和数据获取方面尤其出色。通过自动将346篇学术文章转化为6240张图像，并运用GPT-4V进行自然语言提示分析，该方法在判断和解释关键图表（如氮吸附等温线、PXRD谱图和TGA曲线等）方面的准确率和召回率都在93%以上，强调了模型在数据挖掘中的能力和对化学等领域中数字化数据库建设的潜力。此外，从选定文献中提取的氮吸附等温线数据为200多个化合物的理论和实验多孔性数值提供了比较，凸显了一些差异并强调了整合计算和实验数据的重要性。该研究突出了人工智能在加速科学探索和创新、弥合计算工具与实验研究之间差距、以及推动更高效、更全面和更包容的科学研究的潜力。

Dec, 2023

有限监督的原子级光学化学结构识别

通过图形表示或图像识别分子的化学结构是一项具有挑战性的模式识别任务，在药物开发方面具有很大的好处。我们提出了一种新的化学结构识别工具，该工具提供了最先进的性能，并可以适应少量数据样本和监督下的新领域。与以前的方法不同，我们的方法提供了原子级定位，因此可以将图像分割成不同的原子和键。我们的模型是第一个只使用SMILES监督进行原子级实体检测的OCSR模型。通过严格和广泛的基准测试，我们证明了我们的化学结构识别方法在数据效率、准确性和原子级实体预测方面的卓越性。

Apr, 2024