Nov, 2023

强化学习的扩散模型:综述

TL;DR扩散模型已成为一个突出的生成模型类别,超越了以往的方法,提高了样本质量和训练稳定性。本文概述了这一新兴领域的进展,并希望激发新的研究方向。我们首先研究了当前强化学习算法面临的几个挑战,然后根据扩散模型在强化学习中的角色提出了现有方法的分类,并探讨了如何解决当前的挑战。我们进一步概述了扩散模型在各种与强化学习相关的任务中的成功应用,同时讨论了当前方法的局限性。最后,我们总结了调研结果,并提出了关于增强模型性能和将扩散模型应用于更广泛任务的研究方向。我们正在积极维护一个在 GitHub 上的代码仓库,用于与扩散模型在强化学习中应用相关的论文和其他资源。