MolNexTR: 分子图像识别的广义深度学习模型
本文提出了一种基于SMILES和分子指纹的混合特征的神经网络模型CheMixNet,其用于预测化学物质的性质,与其他候选神经网络体系结构相比取得了更好的效果。
Nov, 2018
本研究利用机器学习中的深度神经网络模型对化学图像进行自动识别和转化,以解决传统工具在检测链的多样性及立体化学信息时产生的错误和丢失原子等问题,并能迅速处理大量图像,从而在药物发现等方面具有重要应用价值。
Feb, 2020
本文介绍了 MolCLR 框架:通过图神经网络的分子对比学习,基于大规模未标记的分子数据集学习不同iable的表征,提供预训练和微调来有效地预测分子性质,实验结果显示该框架在分类和回归任务上显着提高了性能。
Feb, 2021
该研究提出了一种基于MolNet的图神经网络(GNN)模型来获取三维分子的物理化学特性及其非化学键信息,同时该模型在BACE和ESOL数据集的分类和回归任务上皆表现出良好的性能。
Feb, 2022
本文介绍了一个新颖的图像转化成图形结构的模型MolScribe,该模型灵活地融合了象征性化学限制条件,扩展了简略结构,通过数据扩充策略,提高了模型鲁棒性。在合成和逼真的分子图像上的实验中,MolScribe显著优于之前的模型,在公共基准测试中实现了76-93%的准确性。化学家还可以通过模型的置信度估计和原子级对齐来轻松验证MolScribe的预测。
May, 2022
本文提出了一种新颖的、基于分子图像而非化学键的分子表示方法,并称其可以实现相似或更好的分子属性预测结果,表明其拥有超越共价键分子图像的潜力。同时,基于上述发现,本文提出了分子几何深度学习(Mol-GDL)模型,并在14个常用基准数据集上进行了测试,结果表明该模型的效果优于现有的最先进方法。
Jun, 2023
该研究提出了MolGrapher方法,通过视觉识别化学结构,构建分子的自然图形表示,并利用图神经网络分类分子中的原子和键节点。实验证明该方法在大多数情况下明显优于传统和基于学习的方法,可用于加快新材料和药物的发现。
Aug, 2023
MolIG是一种多模态分子预训练框架,通过图像和图结构创新地利用分子图和分子图像之间的一致性和相关性执行自监督任务,有效地将两种分子表示形式的优势融合在一起,这种整体方法能够捕捉关键的分子结构特征和高层次的语义信息,并在分子拓展组和ADMET拓展组等基准组中,相对于先进的基线模型展现出在分子性质预测等拓展任务中性能的提升。
Nov, 2023
该研究展示了GPT-4V的卓越能力,在金属有机框架方面的搜索和数据获取方面尤其出色。通过自动将346篇学术文章转化为6240张图像,并运用GPT-4V进行自然语言提示分析,该方法在判断和解释关键图表(如氮吸附等温线、PXRD谱图和TGA曲线等)方面的准确率和召回率都在93%以上,强调了模型在数据挖掘中的能力和对化学等领域中数字化数据库建设的潜力。此外,从选定文献中提取的氮吸附等温线数据为200多个化合物的理论和实验多孔性数值提供了比较,凸显了一些差异并强调了整合计算和实验数据的重要性。该研究突出了人工智能在加速科学探索和创新、弥合计算工具与实验研究之间差距、以及推动更高效、更全面和更包容的科学研究的潜力。
Dec, 2023
通过图形表示或图像识别分子的化学结构是一项具有挑战性的模式识别任务,在药物开发方面具有很大的好处。我们提出了一种新的化学结构识别工具,该工具提供了最先进的性能,并可以适应少量数据样本和监督下的新领域。与以前的方法不同,我们的方法提供了原子级定位,因此可以将图像分割成不同的原子和键。我们的模型是第一个只使用SMILES监督进行原子级实体检测的OCSR模型。通过严格和广泛的基准测试,我们证明了我们的化学结构识别方法在数据效率、准确性和原子级实体预测方面的卓越性。
Apr, 2024