Gode:将生化知识图谱整合到预训练分子图神经网络中
本文提出了一种名为 “知识引导图转换器的预训练 (KPGT)” 的自监督学习框架,利用高容量的线性图转换器(LiGhT)和知识引导的预训练策略,以解决分子属性预测中存在的两个主要问题,并在大规模无标签分子图上显示出卓越的性能。
Jun, 2022
本文介绍了一种融合领域知识的自我监督分子表示学习模型,通过在对比学习框架下显式编码领域知识,将化学领域知识融合到分子图表示中,证明这种方法可以区分具有相似化学公式但不同功能的分子。在 8 个公共数据集上进行的实验表明,该模型具有显著的有效性,相对于强竞争对手平均有 6%的绝对改进。消融实验和进一步的研究也证实了将化学领域知识纳入自我监督学习的最佳方法。
Mar, 2021
MolIG 是一种多模态分子预训练框架,通过图像和图结构创新地利用分子图和分子图像之间的一致性和相关性执行自监督任务,有效地将两种分子表示形式的优势融合在一起,这种整体方法能够捕捉关键的分子结构特征和高层次的语义信息,并在分子拓展组和 ADMET 拓展组等基准组中,相对于先进的基线模型展现出在分子性质预测等拓展任务中性能的提升。
Nov, 2023
提出了一种基于图神经网络模型的最新、高效的多任务预测方法,结果表明,多任务学习可以提高模型性能,特别是数据点较少的数据集可以不需要数据增强,便能获得较好的效果,并且能显著减小模型的方差。
Oct, 2019
将自然语言和图形表示相结合,通过对齐神经图形表示和特性文本描述的表示,提高了下游分子属性分类任务的性能,实现了与仅以图形方式进行预训练的模型相比的 + 4.26% AUROC 的增益,并相对于最近提出的分子图 / 文本对比训练的 MoMu 模型 (Su et al. 2022) 的 + 1.54% 增益。
Jul, 2023
该研究提出了一种基于 2D 分子图的分子几何预训练模型,通过自监督学习方法,使其能够生成隐含的 3D 信息,显著提升各种性质的预测表现,并可跨多个不同的分子空间进行有效的迁移学习。
Oct, 2021
我们提出了一种预训练方法,使用现有的分子构形数据集生成适用于多个构形的潜在向量,从而解决了获取多个构形的计算成本高的问题,并展示了我们的模型在分子性质预测方面优于使用分子图和三维分子结构的现有预训练方法。
Dec, 2023
本文重点研究了药物发现方面的自动优化工具,并且提出了一种基于图像及其翻译方法的分子优化技术,利用其原子级编码和自回归图形解码器解决分子结构中的多个技术挑战。同时,我们的模型在多项任务中显著优于现有的基准模型。
Jun, 2019