分析学习的分子表征进行性质预测
本研究对比了随机森林、MolBERT 和 GROVER 三种基于 Extended-Connectivity Fingerprint、SMILES 字符串和分子图的分子表示学习模型,评估了其在 MoleculeNet 数据集和类阿片类物质数据集预测方面的效果,并探讨了数据集分布、活性悬崖、模型评价、任务设定和化学空间泛化等方面对模型效果的影响,旨在为提高该领域人工智能技术贡献可能的思路。
Sep, 2022
将自然语言和图形表示相结合,通过对齐神经图形表示和特性文本描述的表示,提高了下游分子属性分类任务的性能,实现了与仅以图形方式进行预训练的模型相比的 + 4.26% AUROC 的增益,并相对于最近提出的分子图 / 文本对比训练的 MoMu 模型 (Su et al. 2022) 的 + 1.54% 增益。
Jul, 2023
我们开发了一套深度学习方法和综合工具,针对分子属性预测和药物发现,跨越不同的计算模型、分子表示和损失函数。我们将分子表示为图和序列,并围绕这些表示所构建的深度模型进行学习。为了有效地从高度不平衡的数据集中学习,开发了优化精度 - 召回曲线下面积的先进损失函数。在在线和离线抗生素发现和分子属性预测任务中的结果表明,我们的方法相对于之前的方法实现了持续的改进,并在与 COVID-19 相关的 AI Cures Open Challenge 中以 ROC-AUC 和 PRC-AUC 方面均排名第一。
Dec, 2020
本研究提出了多种分子图表示法,探究了它们对模型学习和解释的影响,结果显示将原子图表示和减少的分子图表示相结合可以产生具有前途的模型性能。 此外,解释结果可以提供与背景知识一致的重要功能和潜在子结构。这些多个分子图表示和解释分析可以提高模型理解,并促进药物发现相关应用。
Apr, 2023
提出了一种基于图神经网络模型的最新、高效的多任务预测方法,结果表明,多任务学习可以提高模型性能,特别是数据点较少的数据集可以不需要数据增强,便能获得较好的效果,并且能显著减小模型的方差。
Oct, 2019
在这篇论文中,我们提出了一种基于图结构学习的分子性质预测方法,称为 GSL-MPP。我们使用图神经网络(GNN)提取分子表示,构建分子相似性图并进行图结构学习,最终获得能够结合分子间关系的分子嵌入。实验结果表明,我们的方法在大多数情况下都达到了最先进的性能水平,尤其在分类任务上表现出色。
Dec, 2023
本研究提出了可推广和可转移的分层图卷积神经网络(MGCN)以预测分子性质。研究中将每个分子表示为图以保留其内部结构,并且通过多级交互从构象和空间信息直接提取特征,从而可以利用多级总体表示来进行预测。实验结果显示 MGCN 具有显著的泛化能力和可转移性。
Jun, 2019
本文提出了一种基于 SMILES 和分子指纹的混合特征的神经网络模型 CheMixNet,其用于预测化学物质的性质,与其他候选神经网络体系结构相比取得了更好的效果。
Nov, 2018
该论文介绍了使用基于深度神经网络的机器学习方法来改进药物发现过程中分子属性预测的性能,包括设计出的 PotentialNet 结构和 EF$_{chi}^{(R)}$ 指标以及交叉验证策略等,并在多个基于配体的任务中验证了模型性能的创新性。
Mar, 2018