AdsorbRL：逆催化剂设计的深度多目标强化学习

Dec, 2023

AdsorbRL：逆催化剂设计的深度多目标强化学习

AdsorbRL: Deep Multi-Objective Reinforcement Learning for Inverse Catalysts Design

Romain Lacombe, Lucas Hendren, Khalid El-Awady

TL;DR在清洁能源转型中，开发用于低排放技术的催化剂是一个核心挑战。本文介绍了 AdsorbRL，一种基于深度强化学习的代理机制，旨在通过离线学习 Open Catalyst 2020 和 Materials Project 数据集来识别潜在的催化剂，以达到多目标结合能目标。我们实验了 Deep Q-Network 代理机制，通过基于仅在 2,000 至 3,000 个催化剂吸附能已知的非常稀疏的奖励，遍历了 55 种化学元素的大约 160,000 种可能的一元、二元和三元化合物空间。为了限制行动空间，我们引入了随机边遍历，并在已知状态子图上训练了一个单目标 DQN 代理机制，发现目标结合能平均提高了 4.1 个电子伏特。我们将这种方法延伸到多目标、目标条件学习，并训练了一个 DQN 代理机制，以找到多个目标吸附物的具有最高（或最低）吸附能量的材料。我们实验了一种新的训练方案，称为 Objective Sub-Sampling，旨在鼓励在多目标设置中进行探索，并证明了在所有目标吸附物上同时提高吸附能平均 0.8 个电子伏特。总体而言，我们的结果表明，将深度强化学习应用于反向催化剂设计问题具有很大的潜力。

Abstract

A central challenge of the clean energy transition is the development of catalysts for low-emissions technologies. Recent advances in machine lea

clean energy transition catalysts machine learning quantum chemistry deep reinforcement learning

发现论文，激发创造

异质催化吸附能量的可解释性数据驱动建模

通过将机器学习技术与可解释人工智能（XAI）相结合，我们的研究旨在构建一个坚固的框架，利用 OC20 等大型数据集，通过模型可解释性来改进催化剂设计。

May, 2024

催化剂 - 吸附剂三维相互作用对放松能量预测的重要性

研究了使用机器学习预测和发现材料性质的方法，重点放在图神经网络上，并探讨了在忽略相对位置信息的情况下预测系统松弛能量的可行性，结果显示修改后的模型能够相对准确地预测系统的松弛能量。该研究为加速材料发现提供了未来的研究方向。

Oct, 2023

CHEMREASONER: 采用量子化学反馈的大规模语言模型知识空间的启发式搜索

我们通过将计算机辅助筛选框架与语言推理和量子化学相结合，创造性地实现了人工智能加速的可靠催化剂发现。

Feb, 2024

分布式强化学习在分子设计中的应用：抗氧化剂案例

DA-MolDQN 是一个分布式强化学习算法，结合了深度强化学习和关键化学属性，用于优化抗氧化剂，其训练时间较之前的算法快 100 倍，能够从专有和公共抗氧化剂中发现新的优化分子。

Dec, 2023

强化学习在以量子力学为导向的分子设计中的应用

本文提出了一种新颖的基于强化学习的分子设计方式，使用笛卡尔坐标系来扩展分子结构类型，并利用快速量子化学方法对基本物理性质（如能量）进行直接奖励函数的构建。同时，引入了名为 MolGym 的强化学习环境，在该环境中针对多种具有挑战性的分子设计任务成功展开实验，并在此基础上，构建出一种翻译及旋转不变的状态空间，实现了从零开始的高效学习。

Feb, 2020

通过深度强化学习优化分子

本文提出了一种名为 Molecule Deep Q-Networks（MolDQN）的框架，通过融合化学领域知识和最先进的强化学习技术（双 Q 学习和随机化价值函数）进行分子优化，直接修改分子以确保 100％的化学有效性，并通过多目标强化学习扩展模型以同时最大化药物样本度和维持原始分子与优化后分子的相似性，通过展示化学空间中的路径来帮助理解模型的工作方式。

Oct, 2018

催化剂探索中的轻量级几何深度学习

新技术对于大规模采用风能和太阳能等可再生能源是必要的。发现适合的催化剂对于使能量储存更具成本效益和可扩展性至关重要。这项研究旨在评估使用更轻量级方法在这一任务中获得的性能和洞察力，以鼓励来自不同背景的个人的参与。通过实施稳健的设计模式，如几何和对称的信息传递，我们能够训练一个 GNN 模型，在仅使用一小部分可训练参数的情况下，达到了 0.0748 的平均绝对误差，与 SchNet 和 DimeNet++ 等已建立的模型架构相媲美。

Apr, 2024

基于多准则贝叶斯优化与表示学习的自适应催化剂发现

通过高通量计算催化剂筛选方法，在高维度催化剂结构中实现自动化表征学习并具备原则性不确定性量化，探索二氧化碳还原反应的催化剂发现，实现了高预测准确性、可解释的特征提取以及多准则设计优化，大幅降低计算资源和时间成本（需要的密度泛函理论计算减少 10 倍）来进行高性能催化剂的发现。

Apr, 2024

自适应内在奖励的分子强化学习用于目标导向的分子生成

Mol-AIR 是一种基于强化学习和自适应内在奖励的分子生成方法，通过结合深度生成模型和增强学习来有效地生成具有特定性质的分子结构，优于现有方法在无先验知识的情况下生成具有期望性质的分子。

Mar, 2024

利用强化学习和变形金刚搜索高价值分子

通过对不同的文本语法设计和训练算法选择进行广泛的实验，我们提出了一种新的基于强化学习的分子设计算法（ChemRLformer），并通过对 25 个分子设计任务的深入分析，包括计算复杂的蛋白质对接模拟，发现了这个问题领域的独特见解，并展示了 ChemRLformer 在文本分子设计中所取得的最新成果，同时还揭示了哪些设计选择对于文本分子设计实际上有帮助。

Oct, 2023