Jan, 2024

通过自适应学习稀疏子空间加速黑盒分子性质优化

TL;DR分子属性优化 (MPO) 问题是困难的,因为它们在离散、非结构化的空间中定义,并且标记过程涉及昂贵的模拟或实验,基本上限制了可用数据量。贝叶斯优化 (BO) 是一种用于高效优化有噪声、黑盒目标函数 (例如,测量的属性值) 的强大且流行的框架,因此对于 MPO 来说是一个潜在的吸引人的框架。为了将 BO 应用于 MPO 问题,必须选择一种结构化的分子表示方法,能够构建概率代理模型。已经开发了许多分子表示方法,然而它们都是高维的,这在 BO 过程中引入了重要挑战 —— 主要是由于维度的诅咒使得很难对合适的代理模型类定义和执行推理。本研究中,我们展示了这些方法有被 “困住” 的倾向,我们假设产生这种现象是因为从编码空间到属性值的映射不一定由高斯过程很好地建模。我们提倡一种替代方法,将数值分子描述符与稀疏的轴对齐高斯过程模型结合起来,能够快速识别对模拟未知属性函数最相关的稀疏子空间。我们证明了我们提出的方法在各种基准测试和实际问题中显著优于现有的 MPO 方法。具体地,我们展示了我们的方法可以在 100 个或更少的昂贵查询中在超过 100,000 种可选分子中经常找到近乎最优的分子。