在这项研究中,我们探讨了如何利用大语言模型中的上下文学习来预测非分布材料特性,并通过将 GPT-2 作用于几何感知图神经网络的输出,实现了对原子级几何特征的传递,大大提高了模型在非分布示例上的性能,并超越了一般图神经网络模型。
Jun, 2024
利用 MolecularGPT,基于大规模语言模型对分子指令进行微调,并通过零样本和少样本的上下文学习,在少样本分子预测任务中取得新的竞争性结果,显示出语境推理能力优势,超过传统的图神经网络方法和现有语言模型基线,为语言模型在少样本分子特性预测中的应用发展提供了潜力。
该研究提出了一种新的少样本药物发现方法,通过 Modern Hopfield Network 的参照分子对支持集和查询集中的分子进行表示丰富,从而成为药物发现中新的最优方法。
Apr, 2023
本文介绍了一种新颖的用于少样本分子属性预测的模型 Meta-MGNN,该模型利用分子图神经网络学习分子表示,并构建元学习框架进行模型优化,在公共数据库上的实验结果表明,Meta-MGNN 优于其他多种先进的方法。
Feb, 2021
使用 Large Language Models (LLMs) 进行零 / 少量数据量的分子分类以及利用由 LLMs 生成的文本解释作为分子表示,可以大大提高分子属性预测的精度。
Jul, 2023
本篇论文提出了一种基于局部相互作用模型和主动学习算法的新型机器学习算法,可以在较小的训练集上提供高精度预测,并显著减少异常值误差,从而为材料设计和药物发现等领域提供更有效的高通量筛选方法。
Sep, 2017
使用自监督学习和分子结构内的层次知识,该论文提出了一种新的学习框架,从而可以准确预测分子属性并在各种基准测试中取得竞争性表现。
Nov, 2023
为了有效利用分子和性质之间的多对多关系,我们提出了一种基于图采样的元学习(GS-Meta)框架来解决少样本分子属性预测问题。在五个常用基准测试中,GS-Meta 方法在 ROC-AUC 上始终优于现有技术 5.71%-6.93%,并验证了每个提议模块的有效性。
Jun, 2023
通过引入一种新的分层适应机制(HiMPP),可以在生物医学应用中有效地解决少样本学习问题,提高分子属性预测的效果。
Oct, 2023
将自然语言和图形表示相结合,通过对齐神经图形表示和特性文本描述的表示,提高了下游分子属性分类任务的性能,实现了与仅以图形方式进行预训练的模型相比的 + 4.26% AUROC 的增益,并相对于最近提出的分子图 / 文本对比训练的 MoMu 模型 (Su et al. 2022) 的 + 1.54% 增益。