- 分子设计中贝叶斯优化的常见问题诊断与修复
贝叶斯优化是一种原则性的分子设计方法,本文解释了贝叶斯优化中存在的三个问题,即先验宽度错误、过度平滑和不充分的收购函数最大化,在解决了这些问题之后,即使是基本的贝叶斯优化设置也能在 PMO 分子设计基准测试中取得最高的整体性能,这些结果表明 - 基于不确定性指导下的变分自编码器精细调优强化生成分子设计
通过性能反馈在主动学习环境中,我们提出了一种预先训练的变分自动编码器 (VAE) 基因设计模型的模型不确定性引导微调的新方法,通过量化生成模型中的模型不确定性,扩展了有效分子的空间,并利用多样性解码器探索生成优化的多个高性能模型,实验结果表 - 在三维空间中塑造分子:一种灵活的基于子结构的文本导向分子优化框架
通过 3DToMolo 这一多模式引导生成 / 优化任务的文本结构对齐对称扩散框架,我们提出了一种创新方法来解决分子设计问题,取得了优于现有方法的结果表现,并能够生成包含指定目标亚结构的新型分子。
- Gotta be SAFE: 分子设计的新框架
通过引入序列附加式片段嵌入(SAFE)作为化学结构的新型线型表示方法,我们有效地解决了传统分子字符串表示(如 SMILES)对人工智能驱动的分子设计所带来的挑战,同时简化了复杂的生成任务,并且通过在具有片段约束的设计中进行自回归生成,消除了 - 核弹性自编码器用于分子设计
基于变换器结构的核弹性自编码器(KAE)是一个自我监督的生成模型,通过修改的最大均值偏差和加权重构函数,解决了同时实现有效生成和准确重构的长期挑战,并在分子设计中取得了显著的多样性和近乎完美的重构,超越了之前的分子生成模型。KAE 实现了条 - 更表达性的图神经网络是否在生成任务上表现更好?
通过将图生成模型的基本 GNN 替换为更具表达能力的 GNN,我们研究了 GNN 在分子图生成任务中的表现,通过对 ZINC-250k 数据集上的六种分子生成目标在两种不同生成框架(GCPN 和 GraphAF)中的六种 GNN 的性能进行 - QM9 分子量子哈密顿量预测 QH9 基准测试
本文介绍了一种基于监督学习方法的量子哈密顿矩阵预测模型,该模型利用 QM9 数据集中的分子动力学轨迹和稳定分子几何结构生成了一个准确的 QH9 量子哈密顿矩阵数据集,并设计了各种不同分子的基准测试任务,该模型可对任意分子预测哈密顿矩阵,并在 - 增强记忆:利用经验重放加速全新分子设计
本研究提出了一种名为增强记忆的算法,通过数据增强和经验回放相结合,实现了序列建模中的采样效率的提升,相较于之前使用的算法,在药物发现的任务上表现更优。
- 语言模型能够直接在三维空间中生成 XYZ、CIF 和 PDB 文件的分子、材料和蛋白质结合位点
本文研究利用语言模型进行分子设计,探讨了通过正常神经网络训练的语言模型在不修改结构的情况下,如何从多种显著不同的化学结构产生三维化合物、晶体和蛋白质结合位点。同时,讨论了语言模型的优点和局限性,并强调了无需使用简化的分子表示方法进行训练即可 - GraphVF:用变分流控制生成特定蛋白质三维分子
GraphVF 模型结合 2D 拓扑和 3D 几何学,实现了可控的 3D 分子生成,可生成具有定制化子结构和生理化学属性的绑定分子,并达到了最先进的绑定亲和力和逼真的亚结构布局。
- CHA2: 面向反向分子设计的化学感知凸包自编码器
通过使用自编码器将分子结构转换为潜在空间,再通过在高 QED 分子周围构建凸包来限制搜索空间,以优化分子设计和发现新的化学结构。
- 利用多任务语言建模统一分子和文本表示
提出了一种多领域、多任务的语言模型,能够处理化学和自然语言,并共享模型参数来优化实验室操作和科学发现加速。
- 基于图形的深度生成模型用于新型 PROTAC 设计
通过生成模型和加强学习,我们展示了在缺少数据的情况下,如何基于 PROteolysis TArgeting Chimeras(PROTACs)的特性设计出一类具有卓越的蛋白质降解能力的新型分子。
- 基于强化学习的可扩展基于碎片的三维分子设计
本文提出了一种基于强化学习框架的分层代理方法,能够在三维空间中逐步放置分子亚结构,从而高效地学习如何建造具有不同分布的分子,包括药物样分子、有机发光二极管分子和生物分子,只利用能量考虑即可。
- 自底向上综合规划和可合成分子设计的摊销树生成
本文通过采用基于马尔可夫决策过程的条件合成路径生成的分散方法及神经网络模型,解决了分子设计和合成规划两个问题,并成功实现了从底层开始的综合规划和设计合成方法。
- 面向对称性的三维分子设计的演员 - 评论家算法
使用深度强化学习自动化分子设计,在利用基于图形表示法设计分子的进步存在基本限制的情况下,我们提出了一种新的三维分子设计策略,该策略通过基于球谐级数展开的旋转协变的状态 - 动作表示法利用了设计过程的对称性,进而产生了先前方法无法实现的分子结 - 基于分子力学驱动的多重图图神经网络用于分子结构
该论文提出了一种基于分子力学的方法,通过将每个分子表示为一个双层多重图,并为每层提出相应的消息传递模块,设计了一种高效且表达能力强的分子结构图神经网络 MXMNet,可用于从分子结构预测物理化学性质,获得了优越的结果。
- GEOM:用能量注释的分子构象进行性质预测和分子生成
使用密度泛函理论和高级采样方法生成超过 450,000 种分子的 3D 构象,这将有助于从构象集合中预测分子性质并进行生成模型的开发。
- 强化学习在以量子力学为导向的分子设计中的应用
本文提出了一种新颖的基于强化学习的分子设计方式,使用笛卡尔坐标系来扩展分子结构类型,并利用快速量子化学方法对基本物理性质(如能量)进行直接奖励函数的构建。同时,引入了名为 MolGym 的强化学习环境,在该环境中针对多种具有挑战性的分子设计 - ICML通过随机迭代目标增强改进分子设计
本文提出了一种自我训练的迭代方法,该方法利用简单的属性预测模型来过滤候选结构,提高生成模型的预测效果,并在无条件和条件下的分子设计中均获得了显著的性能优势。