- 基于 Bert、Roberta 和 Xlnet 的分子性质预测集成模型
提出了一种新的方法,通过集成学习和 BERT、RoBERTa 和 XLNet 的监督微调,无需进行大量预训练即可高精度预测分子属性,解决了实验组面临的计算资源有限的问题,提供了一种具有成本效益和资源高效的解决方案,可能推进分子领域的进一步研 - 层次提示下的差异分子表示方法在多标签性质预测中的应用
我们的研究介绍了一种 Hierarchical Prompted Molecular Representation Learning Framework (HiPM),通过任务感知的提示,增强了分子表示中任务的差异表达,并利用标签之间的共享 - 从小数据集进行分子属性预测的迁移学习
通过使用小样本数据集进行基于机器学习方法的分子属性预测,研究发现使用消息传递神经网络(PaiNN)以及 SOAP 分子描述符与梯度提升回归树方法相结合的简单分子描述符能够获得最佳预测结果。进一步提出了一种使用大样本数据进行预训练,并在原始数 - ICMLDecompDiff:基于分解先验的扩散模型用于基于结构的药物设计
设计 3D 配体是药物发现中的基本任务,该研究通过将配体分解为两部分,即臂和骨架,并提出了一种新的扩散模型,DecompDiff,以及在模型中结合了键扩散和采样阶段的有效性指导,实现了生成高亲和力分子并保持适当分子性质和构象稳定性的最新性能 - 领域知识和多模态对智能分子性质预测的影响:一项系统调查
综合审视和数量分析基于各种基准的最新深度学习方法,我们发现融合分子信息不仅能提高分子属性预测回归和分类任务的准确性,还能通过同时利用 1 维和 2 维信息的 3 维信息大幅增强分子属性预测进展,在药物研发中具有重要指导意义。
- 在化合物空间中使用低维描述符高效插值分子性质
凭借低维描述符,展示了一种精确的基于数据不足的分子性质模型,用于化合物空间内的插值,结合了三维普适物理描述符和基于 Gershgorin 圆定理的六维特征,通过变量函数形式的核进行高斯过程回归,从而实现了极为高效的低维插值模型。此模型能够在 - ICLR多参数持久同调用于分子属性预测
基于多参数持久同调的分子指纹生成方法揭示了分子几何结构内部的潜在结构和关系,并检测出在多个尺度和多个参数(如原子质量、偏电荷和化学键类型)上具有持续性的拓扑特征,该方法还可以通过加入其他参数(如电离能、电子亲和力、手性和轨道杂化)进一步增强 - 通过潜在空间融合提高分子属性预测
本文提出了一种多视图方法,将来自最先进化学模型的潜在空间进行结合,其中使用了基于 MHG-GNN 的嵌入(将分子结构表示为图形)和根植于化学语言的 MoLFormer 嵌入。我们通过在六个基准数据集上评估该方法,证明了我们所提出的多视图方法 - 基于协变量偏移的密度估计的药物属性预测
使用 CoDrug 方法,结合能量模型和核密度估计,解决药物发现任务中的分布变化问题,提供有效的预测集并纠正协变量变化。与未调整协变量变化的 conformal prediction set 相比,CoDrug 能够减少超过 35% 的覆盖 - 用于科学综合、推理和解释的大型语言模型
使用大型语言模型进行科学综合、推理和解释,通过从科学文献综合知识,将其应用于预测分子属性等任务,提高了当前机器学习系统的性能,并能解释其预测结果,将加速科学发现的进程。
- Lo-Hi: 实用的机器学习药物发现基准
用机器学习模型预测分子性质是药物发现的一种希望,研究表明现有基准模型与实际应用存在较大差异,因此创建了一个新的实际型基准模型 “Lo-Hi benchmark”,以实现药物发现过程中的主要任务之一 —— 化合物分析。
- Transformers 高效分层化化学图学习器
SubFormer 是一种图变换器,通过消息传递机制对子图进行操作,减少了标记数量,增强了学习长距离交互的能力。在预测分子属性和化学结构方面,SubFormer 与最先进的图变换器相比,在计算成本的一小部分情况下保持着竞争力,并且在消费级显 - 结构与属性:化学元素嵌入和深度学习方法用于准确预测化学性质
利用深度学习技术构建的新型机器学习模型,对多种输入数据进行分类任务,包括有机和无机化合物,并在 Matbench 和 Moleculenet 基准数据集上进行开发和测试,揭示了化合物的底层模式。该模型在分子和材料数据集上表现出很高的预测能力 - ICML分层语法引导几何用于高效的分子属性预测
通过使用可学习的分层分子语法,我们提出了一种数据高效的性质预测方法,可以从语法生成规则中生成分子,并利用次级空间的几何信息进行性质预测,从而在有限数据情况下优于其他方法。
- 基于曲率的变换器用于分子性质预测
基于曲率的 Transformer 通过引入离散化的里奇曲率来改进图变换器神经网络模型对分子图数据中的结构信息的提取能力,通过将图的曲率信息作为位置编码添加到节点特征中进行注意力计算,这种方法能够在不改变原有网络架构的情况下引入图数据的曲率 - MUBen:针对分子属性预测的预训练模型不确定性基准测试
本文介绍了如何使用不确定性量化(UQ)方法来改善预测分子属性的大型 Transformer 模型的置信度,并评估了不同的 backbone 和 UQ 模型组合的性能,提供了关于选择 UQ 和 backbone 模型的见解。
- Gode:将生化知识图谱整合到预训练分子图神经网络中
本文提出了一种新的方法,将单个分子结构的图形表示与生物医学知识图的多领域信息相结合,利用自监督策略进行预训练,成功地应用于化学性质预测任务,取得了超过现有最先进模型的表现。
- MM使用 DIONYSUS 在低数据化学数据集上的概率模型校准和推广性
本文研究了概率机器学习模型在小化学数据集上的建模效果,通过实验评估了不同分子表示和模型的预测和不确定性,并提供了关于模型和特征选择的实用见解,为新型化学实验中常见的场景提供了帮助。
- 将 SMILES 的语言知识融入化学语言模型
本研究使用 SMILES 语法解析技术从 SMILES 中获取子结构的连接性和类型背景知识并将其注入转换器模型,从而提高了分子属性预测的性能。
- 通过图卷积网络生成分子
本文介绍了一种基于图卷积网络模型和输入归因方法的自动生成新分子方法,解决了药物设计中如何确定哪些分子的哪些方面对其最终活性 / 性能是更有影响力的问题。同时也探讨了过度优化和适用性两个问题的应用实例。