- 利用流匹配与尺度最优传输进行高效的三维分子生成
通过引入可伸缩的 E (3)- 等变消息传递体系结构 Semla 和使用流匹配训练的分子生成模型 MolFlow,本研究解决了当前 3D 药物设计中的慢速采样和生成化学有效分子的问题,并且提出了用于无条件分子生成器的新的基准度量方法,最终实 - 药物设计中的扩散模型
扩散模型在 3D 分子生成方面已经成为强大的工具,特别是在药物发现领域。这篇综述着重于定制 3D 分子生成的扩散模型的技术实现,比较了各种用于分子生成任务的扩散模型的性能、评估方法和实现细节,并探讨了扩散模型在药物设计以及与计算化学相关的领 - 变分流匹配用于图生成
我们提出了一种称为变分流匹配 (VFM) 的流匹配式变分推理,即基于这个公式我们开发了 CatFlow,这是一种用于分类数据的流匹配方法,它易于实现、计算效率高,并在图生成任务中取得了较好的结果。
- 层级文本反转下的高效分子生成
提出了一种新的数据高效分子生成方法 —— 分层文本反转分子生成(HI-Mol),通过多级嵌入来反应分子分布的多层次特征,进而在少量训练数据的情况下生成高质量的分子。
- 潜在化学空间搜索用于插件多目标分子生成
本研究通过开发一种多功能的 “插件” 分子生成模型,结合多个目标相关性、药物相似性和可合成性,来解决多目标生成、模型适应性以及药物发现实际应用中的挑战。在药物发现的背景下,我们改进了粒子群优化算法(PSO),通过比较实验发现 PSO-ENP - GP-MoLFormer: 分子生成的基础模型
训练数据记忆和新颖性受训练数据质量影响;GP-MoLFormer 可用于生成新颖、有效且独特的分子;在三个不同任务上,GP-MoLFormer 表现良好或相当,展示了它的通用性。
- 多性质优化的分子生成对抗网络
通过引入一种基于演员 - 评论家强化学习的生成对抗网络 (GAN) ,称为 InstGAN,将独特的即时和全球奖励的方法用于在分子级别上进行多属性优化,以解决生成对抗网络和强化学习模型的训练不稳定和高计算成本的挑战,实验证明 InstGAN - 教师 - 学生大型语言模型使用多约束分子生成指导
提出了一种多约束分子生成大型语言模型(TSMMG),通过提取多个 “教师” 模型和工具的分子知识构建大量的文本 - 分子对,实现了生成符合各种文本提示描述的新型分子。TSMMG 在生成满足复杂的自然语言描述的化学属性要求的分子方面表现出色, - AAAI基于结构的药物设计的绑定自适应扩散模型
基于结构的药物设计旨在生成与特定蛋白质靶点结合的三维配体分子。本研究提出了一种名为 Binding-Adaptive Diffusion Models (BindDM) 的新框架,通过自适应地提取负责蛋白质 - 配体相互作用的结合位点的关键 - 研究扩散模型对加速电子结构计算的行为
通过对扩散模型进行调查,我们希望能更好地理解它们的预测与基于物理计算的结果之间的比较,以利用机器学习来显著加速电子结构计算,而无需昂贵的原理数据集进行训练。我们发现一种流行的扩散模型用于全新分子生成的推理过程可以分为探索阶段和弛豫阶段,其中 - ChemSpaceAL:一种高效的应于蛋白质特异性分子生成的主动学习方法
通过构建样本空间的表示,使用半监督主动学习方法来精细调整生成模型,使其针对目标函数进行优化,以在化学空间代理内实施,从而最大限度地增强生成的分子与蛋白质靶点之间的吸引相互作用。
- 基于连接感知模体挖掘的新颖分子生成
本文提出了一种新方法 MiCaM,通过基于数据驱动的算法迭代合并子图来挖掘出构建于连接感知的基序上的分子片段,然后构建一个构建于挖掘出的连接感知的基序上的连接感知生成器,实现了生成具有目标性质分子的目的。
- 分子语言模型作为多任务生成器
本文提出了一个经过预训练的分子语言模型 MolGen,通过多任务分子前缀调整自我反馈机制,可以在多个分子生成任务和不同领域(合成和天然产物)中有效地学习和共享知识,进而在众多分子生成基准数据集上获得优越性能。
- 多解码器 VAE 生成基于字符串的分子
本文提出使用多个解码器共享单个编码器的整合技术来改进变分自动编码器在字符串基分子生成任务中的性能,利用两个主要技术:(a)对每个解码器采样不同的潜在变量以鼓励多样性,(b)使用协同损失来控制使用不同潜在变量的解码器的聚合质量。在实验中,该方 - 一种配体和结构双驱动的深度学习方法,用于发现高效的 GnRH1R 拮抗剂,治疗子宫疾病
本研究开发了一个基于深度学习的框架来发现具有理想性质的 GnRH1R 口服小分子药物,并使用 LS-MolGen 模型进行分子生成和筛选,实验验证了 3 种候选药物的潜在抑制活性和药代动力学性质,并认为该工作流程可以延伸至类似的新药设计和优 - ICML三维分子生成的等变扩散
本研究提出了一种 E (3) 等变扩散模型 (EDM),该模型学习使用等变网络对包含连续(原子坐标)和分类特征(原子类型)两种特征的扩散过程进行去噪。同时,基于该模型提供了一种概率分析方法,可以计算出基于该模型生成的分子的似然。实验证明,相 - ICLR分子生成的数据有效图形语法学习
本文提出了一种数据效率的生成模型,其核心是可学习的图形语法,能够从比常规基准小几个数量级的数据集中学习,生成高质量的分子。
- 基于模式图的分子属性预测自监督学习
本研究介绍了一种基于图形的分子数据的自我监督学习的新型方法,称为基于图案的图形自我监督学习(MGSSL)。我们提出了一种依赖于自生成基元的新的预训练框架来捕获分子图中的丰富信息,该框架可以在宽度优先或深度优先的方式下执行,并在不同的下游基准 - ICML生成分子图的图形 VAE 和图形 Transformer 方法
本论文提出了一种结合了变分自动编码器和基于变压器模型的图卷积和图池化层的方法,直接对图进行操作,能够生成具有可解释特性的潜空间和有效生成分子的模型。
- KDD用于药物发现的深度图生成模型可视化
提出了一种可视化框架,用于可视化深度图形生成模型的编码和解码过程中生成的分子,并提供实时分子优化功能,这完善了黑盒子人工智能驱动的药物发现模型的可解释性。