- 可转移的玻尔兹曼生成器
Boltzmann Generators that are transferable across chemical space are proposed to generate approximate samples of molecul - 肉豆蔻和香料:生物分子机器学习的模型和数据
SPICE 数据集的第 2 版是一个用于训练机器学习势能的量子化学计算集合,通过更多地对化学空间进行采样和提供更多非共价相互作用的数据,扩展了原始数据集。在其中,我们使用名为 Nutmeg 的一组潜在能量函数。它们采用一种新的机制,在带电和 - GLaD:在有机光伏装置中,将分子图和语言描述相结合以提高功率转换效率预测
通过整合分子图像和语言描述符进行增强光伏转换效率(PCE)预测的一种名为 GLaD 的新方法,利用大规模语言模型(LLM)从广泛的科学文献中预训练来丰富分子结构表示,实现了对 PCE 的精确预测,并促进了合成具有改善效率的新型有机光伏分子的 - 用偏好优化在规模化的化学空间中搜索能量排名对齐
通过引入一种称为能量排序对齐 (ERA) 的算法,我们可以优化自回归策略,利用显式的奖励函数来生成具有所需属性的分子,该算法与接近政策优化 (PPO) 和直接优化偏好 (DPO) 密切相关,并且在配对的首选项观察数量较少时相对于 DPO 性 - 自适应网络嵌入聚类分子能量景观
通过应用最近发展的网络嵌入技术,以压缩系统维度来实现小分子化学空间的高效探索,我们提出了一种数据驱动的方法,通过聚类分子结构的势能景观,获得通过嵌入函数定义的潜在变量。为了提高方法的扩展性,我们还结合了一种基于 Metadynamics 和 - 用好奇心作为自我监督的方法,以改善 De novo 药物设计中的探索
我们介绍了一种基于好奇心驱动的方法,通过在化学空间的许多部分导航,从而实现更高的理想性和多样性。这种方法通过训练一个基于递归神经网络的分子生成器,并在此基础上进行微调,通过最大化好奇心和理想性来发现更多以及更易合成的理想分子。
- HypBO: 专家引导化学家参与贝叶斯搜索新材料
机器人技术和自动化为解决材料发现等难以处理的多变量科学问题提供了巨大的加速,而巨大的搜索空间可能令人望而生畏。贝叶斯优化(BO)已成为一种流行的高效样本优化引擎,在目标函数 / 属性没有已知的解析形式的任务中蓬勃发展。本文利用专家人类假设的 - 语言模型能够直接在三维空间中生成 XYZ、CIF 和 PDB 文件的分子、材料和蛋白质结合位点
本文研究利用语言模型进行分子设计,探讨了通过正常神经网络训练的语言模型在不修改结构的情况下,如何从多种显著不同的化学结构产生三维化合物、晶体和蛋白质结合位点。同时,讨论了语言模型的优点和局限性,并强调了无需使用简化的分子表示方法进行训练即可 - 基于整数规划和超平面分割数据集的分子设计
提出了一种可通过机器学习构建预测函数,利用分子结构与化学空间数据的预测模型以优化化合物的化学性质。
- 基于 GC-EI-MS 光谱的小分子的去新识别
本文介绍了一种用于 GC-EI-MS 数据的基于机器学习的新型的 de-novo 方法,主要解决由于缺乏附加信息而导致的质谱数据的结构鉴定问题。
- CoSP:口袋和配体的共同监督预训练
提出了 CoSP 框架,结合了口袋和配体表示的共同监督预训练,注入口袋 - 配体相互作用知识通过对比损失来学习生物学意义的嵌入表征,并提出化学相似度增强的负样本采样策略,取得了口袋匹配、分子属性预测和虚拟筛选等方面的有竞争力的结果。
- ICLR已探索的化学空间有多大?衡量数据库和机器生成分子覆盖的化学空间
通过构建一个评估框架,该论文提出了一种新的化学空间覆盖度计算方法 #Circles,并表明许多药物生成模型未能探索更大的空间,从而为改进药物生成模型提供了新的机会。
- MM探索化学空间的好奇心:深度分子强化学习的内在奖励
本研究提出了一种灵感来源于好奇心的算法来帮助增强学习智能体在化学空间中实现高效探索,并在三个基准测试中展示了好奇心智能体可以找到表现更好的分子。这可能将带来出人意料的新分子,从而打破药物和材料发现领域。
- 使用强化学习学习如何导航合成可达的化学空间
本研究提出了一种基于增强学习框架的新型前向合成模型 (PGFS),可以解决化学分子结构的可合成性和合成路线问题,该模型可以为机器学习的药物设计提供一个有挑战性的基础测试平台。
- 生成对抗网络在晶体结构预测中的应用
本文提出并应用了一种基于生成对抗网络的晶体结构生成模型,经过高通量虚拟筛选,成功预测出 23 个具有良好光稳定性和能隙的新型结晶体结构,并在化学空间中发现了未知的化学结构。
- 生成模型提出的分子可合成性
新型深度学习算法在提高新药发现效率方面表现出色,但其缺乏可合成性的信息,导致其合成难度大幅上升,需要新算法的开发来加以解决。
- 通过深度强化学习优化分子
本文提出了一种名为 Molecule Deep Q-Networks(MolDQN)的框架,通过融合化学领域知识和最先进的强化学习技术(双 Q 学习和随机化价值函数)进行分子优化,直接修改分子以确保 100%的化学有效性,并通过多目标强化学 - ICML化学空间大规模加速探索的并行分布式汤普森抽样
为了解决高吞吐量筛选中大规模问题的局限性,该研究提出了一种基于并行和分布式的 Thompson 采样的可伸缩解决方案,实现了大规模并行贝叶斯优化。结果表明,该方法在大规模问题中表现良好,是大规模并行贝叶斯优化的有效解决方案。
- 循环神经网络(RNNs)生成分子
通过使用递归神经网络和现有的编码分子,研究了在分子库领域生成 “可合成分子” 的方法,以用于计算机辅助药物发现。
- 深度张量神经网络从量子化学角度的洞见
本文提出了一种基于深度张量神经网络(DTNN)的方法,可以实现空间和化学分辨率高的分子系统在量子力学观测量方面的分析,此方法可以用于预测分子的原子能和局部化学势,同位素能和分子的电子结构,为揭示复杂的量子化学体系提供了新的突破。