- LDMol:基于文本条件的分子扩散模型,利用化学信息的潜在空间
LDMol 是一种新颖的潜在扩散模型,能够实现自然语言条件下的分子生成,并通过对比学习策略来提取化学信息特征空间,不仅在文本到分子生成基准测试中超过现有基准,还能进行零样本推理和相关任务如分子到文本检索和以文本为驱动的分子编辑,展示了它作为 - 无需回归模型的分子生成来支持药物反应预测
我们引入了无回归器指导分子生成的方法,以确保在更有效的空间内进行采样并支持药物反应预测。通过实验和理论研究,我们假设基于目标 IC50 得分的条件生成可以获得更有效的采样空间。我们设计了一个常识数值知识图谱来有效地映射药物和细胞系之间的回归 - 一种结合变分自编码器和 Transformer 的新型分子生成模型
这项研究提出了通过结构和参数优化将 Transformer 和 VAE 两种模型相结合的方法,以处理多样化的分子。该模型在生成分子方面表现出与现有模型相当的性能,并且在生成未见结构的分子方面表现出远超卓越的性能。此研究通过 VAE 的潜在表 - 基于注意力的分层变分自编码器的分子生成
将递归神经网络与卷积网络以层次化方式结合,可以从 SMILES 字符串中提取自回归信息并保持信号和长程依赖关系,从而实现了在重构已知分子时非常高的有效性率达到 95%。同时,我们观察到测试集和重构分子之间的平均 Tanimoto 相似性为 - FREED++:通过彻底复制改进基于片段的分子生成 RL 代理
对分子结构进行合理设计的治疗药物旨在通过与特定蛋白质结合来激活或抑制特定蛋白质,分子对接是评估蛋白质 - 分子相互作用的常用技术。本文复现、审查并改进了最近的分子生成强化学习模型 FREED,经过广泛评估发现其中存在若干局限性和挑战,但修复 - 自由形式流动:使任何架构成为标准化流量
我们通过使用梯度的有效估计器来克服了正规化流设计受到解析可逆性需求的约束,并实现了任意保持维度的神经网络作为最大似然训练的生成模型,在分子生成基准测试中取得了出色的结果,同时采用现成的 ResNet 架构在一个反问题基准测试中具有竞争力。
- 遗传算法是分子生成的强大基准
本论文表明,遗传算法是一种强大的生成分子的算法,优于许多复杂的机器学习方法,并提出了遗传算法准则,建议重新评估分子生成的研究。
- 两层扩散和多属性优化:一种生成具有理想特性分子的新方法
本文介绍了一种生成具有理想属性的分子的新方法,该方法通过在分子和分子片段上执行扩散来获取混合高斯分布,并使用新颖的基于电子效应的分解方法优化多个分子属性,从而在人工智能驱动的药物设计和发现方面具有重要的应用前景。
- 联合变压器的全新药物设计
通过使用共享权重的联合生成模型,该研究提出了一种联合 Transformer,通过训练模型生成具有突破性目标性能的新分子,从而在新分子预测和生成上取得了优于现有方法的表现。
- DiffDTM: 面向双蛋白质的生物活性分子条件无结构生成框架
本文提出了 DiffDTM,一种基于扩散模型的条件无结构深度生成模型,将蛋白质序列和分子图作为输入,生成针对特定双蛋白的药物,实现了一次条件样本生成。在多个评估指标方面优于现有技术模型, 可以轻松地应用于新的双蛋白目标,生成具有生物活性的分 - 基于几何深度学习的结构药物设计系统性调查
本文系统地回顾了几何深度学习在基于结构的药物设计中的最近进展,并包括了结合位点预测、结合姿势生成、分子生成、连接器设计和结合亲和力预测等任务的详细综述和相关进展的挑战以及潜在机会。
- 基于功能组的扩散技术,用于口袋特定分子的生成和扩展
本文提出了一种基于 D3FG 的扩散模型,用于口袋特异性分子生成和阐述,将分子分解为刚性体和质点两类组分,两种组分可以组成复杂的片段以增强配体 - 蛋白相互作用,该方法生成的分子具有更为逼真的 3D 结构,竞争性的亲和力以及更好的药物特性。
- RGCVAE: 基于关系图条件的变分自编码器在分子设计中的应用
本文提出了 RGCVAE 方法,使用关系图同构网络进行编码,使用新的概率解码组件进行解码,即可在训练时间显著减少的情况下,展现出与几种最先进的熵编码自编码器相媲美的分子生成性能。
- Lingo3DMol: 基于口袋的三维分子生成语言模型
本文提出了一种基于口袋的三维分子生成方法,利用具有生成 3D 坐标能力的语言模型,并设计了扰动复原预训练任务,介绍了一种新的分子表示方法,并利用 CrossDocked 和 DUD-E 数据集对其进行了评估。该方法在几乎所有指标上实现了最优 - AAAIMDM: 用于 3D 分子生成的分子扩散模型
本文提出了一种新的扩散模型来解决 3D 分子生成中的两大挑战,即缺乏分子间关系和探索不足,该模型表现明显优于现有方法。
- ICLR可控制分子生成的基于检索的方法
本文提出了一种基于检索的分子生成框架,使用例子分子来引导预先训练的生成模型生成符合给定设计标准的分子,通过自我监督目标来训练混合输入分子和示例分子的检索机制,使用迭代改进来动态更新生成的分子和检索数据库,成果表明我们的方法比以前的方法有更好 - ICML基于评分的随机微分方程系统的图生成建模
提出了一种基于得分的图生成模型,采用连续时间框架下的新图扩散过程,通过随机微分方程系统对节点和边缘进行联合分布建模,并提出了适用于该过程的新颖得分匹配目标,通过求解反向扩散过程的方程系统高效采样。通过对多个数据集的验证,该方法在生成具有挑战 - 利用解码器不确定性提高 VAE 潜空间中的黑盒优化
使用表观不确定性来指导潜在空间内的优化过程,利用重要性采样估计表观不确定性来生成更真实且有效的高维离散对象,在数字生成、算术表达式逼近和药物设计的分子生成等多个实验中都表现出优异的性能。
- DGL-LifeSci:用于生命科学图形深度学习的开放源代码工具包
本研究介绍了一个基于 DGL、RDKit 和 PyTorch 的开源包:DGL-LifeSci,为生命科学领域的深度学习提供了一个基于图的模型,在分子属性预测、反应预测和分子生成等任务中都有广泛应用,并且提供了命令行接口方便用户进行编程、深 - 药物发现中的人工智能:应用与技术
这篇综述介绍了近十年来人工智能在药物研发领域的应用,主要包括分子属性预测和分子生成任务,讨论了数据资源、分子表示方法、基准平台和相关技术,旨在为研究人员提供指导,并提供了一个收集论文和代码的 GitHub 存储库作为学习资源。