- 细胞中的分子表示学习
通过信息对齐方法,我们提出了一种学习细胞分子表示的信息瓶颈方法,整合分子和细胞反应数据构建上下文图,优化编码器的潜在表示以丢弃冗余结构信息,并通过对齐分子在上下文图中的不同特征空间来验证所提出的方法在药物疗效和分子性质预测方面的有效性。
- 学习具有结构和非结构知识的多视角分子表示
通过多视角分子表示学习,MV-Mol 模型从化学结构、生物医学文本和知识图谱中提取多视图分子专业知识,并在分子性质预测和多模态分子结构与文本理解方面展现出卓越的性能。
- MoleculeCLA: 通过计算化学配体 - 靶标结合分析重新思考分子基准
构建精确大规模的分子表示数据集,通过深度学习模型为药物发现的人工智能领域提供准确可靠的基准。
- 层次提示下的差异分子表示方法在多标签性质预测中的应用
我们的研究介绍了一种 Hierarchical Prompted Molecular Representation Learning Framework (HiPM),通过任务感知的提示,增强了分子表示中任务的差异表达,并利用标签之间的共享 - SE3Set:利用等变超图神经网络进行分子表示学习
我们在这篇论文中开发了 SE3Set,这是一个针对高级分子表示学习量身定制的 SE (3) 等变超图神经网络架构。SE3Set 的出色性能突显了其在各种分子结构上的转化潜力,为计算化学提供了一条更准确和物理细致建模的途径。
- SubGDiff:一种改善分子表示学习的子图扩散模型
本文介绍了一种新颖的分子表示学习方法,通过将分子子图信息纳入扩散过程中,提升了分子表示学习的效果。实验结果表明,该方法在下游任务中具有更好的性能表现。
- 从化学反应知识中学习上下文分子表示
借助自监督学习的 REM0 框架,基于化学反应的上下文,对分子表示学习进行了预训练,提供了富含化学知识的有意义的上下文表示,用于支持各种下游分子任务,同时在活性分析基准中超过了指纹方法。
- 分子属性预测的图多相似性学习
我们提出了图形多相似学习(GraphMSL)框架,它在连续尺度上捕捉了分子的自相似性和相对相似性,从而显著提高了分子性质预测中的表示学习的效果。此框架通过不同化学模态推导出单峰多相似性度量,融合这些度量到多模态形式中,灵活的融合函数可以重塑 - MotifPiece: 一种基于数据的有效 Motif 提取和分子表示学习方法
本文提出了一种数据驱动的基于统计度量的 MotifPiece 方法用于有效地提取分子中的结构模式,并通过引入异构学习模块作出了全面评估,表明其在提取结构模式方面具有改进,同时还展示了通过合并多个共享足够结构模式的数据集来进一步提高性能的方式 - 利用持久同调改进自监督分子表示学习
基于持久同调的自监督学习在分子表示学习中具有广泛的应用潜力,可以通过不同的数据视角、距离保持的稳定性和灵活性结合领域知识,提高嵌入空间的表示能力和预测性能,同时对非常小的数据集也能获得显著的改进。
- GlycoNMR: 使用图神经网络预测糖类 NMR 化学位移的数据集和基准
分子表示学习(MRL)是一种将分子转化为数值表示并保留其化学特性的功能强大的工具,在机器学习和化学科学之间架起了桥梁。在糖科学领域,MRL 方法的探索相对较少,这主要归因于糖特定数据集的有限可用性和缺乏针对糖数据所提出的机器学习流程。为了解 - 在离散潜空间中学习不变的分子表示
该研究提出了一种新的分子表示学习框架,通过首次编码然后分离的策略在潜空间中识别有不变性和鲁棒性的分子特征,以实现对分布转换的更强的泛化能力,通过自监督学习目标鼓励精确不变性识别,适用于各种任务,如回归和多标签分类。
- UniMAP:通用 SMILES - 图表示学习
本文提出了一种称为 UniMAP 的通用 SMILE-graph 表示学习模型,通过底层嵌入层和多层 Transformer 的使用,实现了跨多模态融合,包括多级跨模态掩码、SMILES-Graph 匹配、片段级对齐和领域知识学习等预训练任 - 分子构象集的学习:数据集与基准
分子表示学习具有在药物发现和酶设计等众多生物化学应用中的显著影响。我们提出了第一个全面评估从同构体集合学习的潜力的 MoleculAR Conformer Ensemble Learning (MARCEL) 基准,并建议有前景的研究方向。 - 分子表示学习中揭示神经比例定律
从数据中心的观点出发,本文研究了分子表示学习的神经缩放行为,在数据量、数据质量和模型容量等四个关键维度上,证实了数据量和分子表示性能之间的一致性幂律关系,并通过详细分析,发现了提高学习效率的可能途径。
- MolCAP:分子化学反应预训练及促进微调增强的分子表示学习
我们提出了一种基于化学反应知识的 MolCAP,它是一个图形预训练变压器模型,用于推动分子表示学习,其结果表明在各种生物医学任务中优于传统预训练框架的比较方法,这表明了应用反应信息进行分子表示学习的前景。
- 原子和子图感知的双向聚合用于分子表示学习
本文通过引入 Atomic and Subgraph-aware Bilateral Aggregation 模型,综合考虑原子和子图两种信息,提高分子性质预测的表示学习,该方法在药物和材料发现等领域具有广泛的应用。
- 在黎曼流形上学习分子谐波表示
本研究提出了一种谐波分子表示学习方法,使用分子表面的 Laplace-Beltrami 特征将分子表示为二维黎曼曼 ifold 上的多分辨率表示,同时采用谐波消息传递方法实现更好的分子编码,达到了与当前模型相当的预测能力,优于最先进的深度学 - ICLR通过对抗协作实现任务无关的图神经网络评估
提出了一个新的基于竞争式自监督的 GraphAC 框架,可以在无需手工增强的情况下,比较不同 GNNs 的表现, 消除了已有方法局限性。 competitive Barlow twins 作为一个新的目标函数,可以让两个 GNNs 在相互竞 - ICLR一种 Transformer 模型可以理解 2D 和 3D 分子数据
本文提出了 Transformer-M 模型,可以对 2D 和 3D 分子结构信息进行编码和语义表示,通过合适的监督信号训练获得对不同数据格式的知识,从而能够广泛应用于不同的任务。