数据驱动的黑箱优化扩散模型
扩散模型是强大且通用的生成式人工智能技术,在计算机视觉、音频、强化学习和计算生物学等领域取得了巨大的成功。本文回顾了扩散模型的新兴应用,理解了它们在各种控制下的样本生成。同时,我们概述了现有的扩散模型理论,涵盖了它们的统计性质和采样能力。进一步地,我们评述了通过条件扩散模型进行高维结构化优化的新途径,将解决方案的搜索重新定义为条件采样问题,并通过扩散模型进行求解。最后,我们讨论了扩散模型的未来发展方向。本文旨在为刺激前瞻性的扩散模型理论和方法提供全面的理论介绍。
Apr, 2024
通过引入一种可以上界反向 Kullback-Leibler 散度且避免要求确切样本似然的损失函数,本研究提出了一种能够解决在不依赖相应训练数据的情况下从难以处理的离散集合中进行采样的问题的方法,并展示了该方法在无数据组合优化中实现了最先进的性能。
Jun, 2024
通过在模型训练过程中加入约束条件使其生成的样本更符合所施加的约束,从而提高生成样本与约束的一致性,且相较于现有方法有更好的性能且不影响推断速度;该方法还可以自然地防止过拟合。
Mar, 2024
探索基于条件扩散模型的奖励定向生成方法和理论。此生成器可有效地学习和采样奖励条件的数据分布,并且生成新的群体移向用户指定的目标奖励值,通过实证研究验证这一理论并探究外推强度与样本质量之间的关系。
Jul, 2023
Diffusion models 可以将高维空间中的随机噪声通过迭代去噪映射到目标流形,来解决强化学习中以目标条件为导向的问题。本文提出了一种名为 Merlin 的方法,利用类似扩散过程的思想,在高维空间中构建从潜在目标状态扩散而远离的轨迹,并通过学习类似分值函数的目标条件策略,能够从任意初始状态到达预定义或新颖的目标。本文在离线目标达成任务上进行理论验证和实证实验,结果表明这种针对序列决策问题的扩散思路是一种简单、可扩展且有效的方向。
Oct, 2023
我们提出了使用扩散模型在数据流形上进行优化的方法,以解决具有未知约束的实际优化问题。通过在 Boltzmann 分布和扩散模型学习的数据分布之间进行采样,我们将原始优化问题转化为采样问题,以限制优化过程在数据流形上进行。通过在初始阶段聚焦在可行解上获得分布,我们的方法在综合实验中展现了与现有的最先进基准方法相当或更好的性能。
Feb, 2024
本文提出了一种名为 RGDM 的模型,通过强化学习(RL)引导扩散模型的训练阶段,从而实现对样本生成的控制。在 3D 形状和分子生成任务上的实验表明,该模型相较于现有的条件扩散模型具有显著的改进。
Apr, 2023
本文介绍了如何使用增强学习方法直接优化扩散模型以实现人类感知的图像质量和药物效果等下游目标,并提出了一种名为去噪扩散策略优化(DDPO)的类策略梯度算法,并进行了实证及效果验证。
May, 2023
通过优化奖励模型的方式,我们采用了一种混合方法来调优顶尖扩散模型,结合了生成模型和基于模型的优化方法的优势,以求解 AI 驱动的设计问题。在离线数据集的常见科学领域中,我们关注的是一个奖励模型未知的离线环境,通过学习静态离线数据集,解决过度优化问题,同时利用奖励模型的外推能力最大化了离线数据中的设计性能。
May, 2024
生成人工智能是指生成合成但逼真的输出的算法。扩散模型在图像生成人工智能中目前达到最高水平,并在包括文本到图像生成器和大型语言模型在内的更通用工具中起着关键作用。
Dec, 2023