扩散模型与表征学习综述
本文探讨了使用一种单一的预训练阶段进行生成性和判别性任务的统一表征学习器 —— 扩散模型,并发现这种模型在图像分类任务中具有优异的性能,特别是在经过精心特征选择和池化的情况下,扩散模型明显优于 BigBiGAN 等其他可比较的生成 - 判别方法
Jul, 2023
这篇综述论文全面地评估了扩散模型技术,并探讨了它们与其他深度生成模型的相关性,建立了理论基础。同时,该论文还总结了扩散模型在医学、遥感和视频等领域应用的情况,提供了常用基准和评估指标的概述,以及针对三个主要任务的扩散模型技术的全面评估。最后,作者指出当前扩散模型的局限性,并提出了未来研究的七个有趣方向。这篇综述论文旨在加深人们对于在低层次视觉任务中的去噪扩散模型领域的全面理解。
Jun, 2024
本文概述了 “扩散模型” 在图像合成、视频生成、分子设计等领域中的应用,并将相关研究分为三大类:高效采样、改进似然估计和处理具有特殊结构的数据。此外,还探讨了将扩散模型与其他生成模型相结合以获得更好结果的潜能,在计算机视觉、自然语言生成、时态数据模型等领域具有广泛的应用。本文旨在提供一个全面的扩散模型综述,指出其重点研究领域并指向未来的研究方向。
Sep, 2022
扩散模型已成为一个突出的生成模型类别,超越了以往的方法,提高了样本质量和训练稳定性。本文概述了这一新兴领域的进展,并希望激发新的研究方向。我们首先研究了当前强化学习算法面临的几个挑战,然后根据扩散模型在强化学习中的角色提出了现有方法的分类,并探讨了如何解决当前的挑战。我们进一步概述了扩散模型在各种与强化学习相关的任务中的成功应用,同时讨论了当前方法的局限性。最后,我们总结了调研结果,并提出了关于增强模型性能和将扩散模型应用于更广泛任务的研究方向。我们正在积极维护一个在 GitHub 上的代码仓库,用于与扩散模型在强化学习中应用相关的论文和其他资源。
Nov, 2023
本综述为关于应用于计算机视觉的去噪扩散模型文章提供了全面的回顾,包括在领域中的理论和实际贡献,提供了三种通用扩散建模框架,并介绍了扩散模型与其他深度生成模型之间的关系,并引入了在计算机视觉中应用扩散模型的多个视角分类,最后,我们说明了离散模型的当前限制并预见了未来研究的一些有趣方向。
Sep, 2022
提出了一种基于扩散的表示学习方法,通过扩展去噪得分匹配框架实现无监督学习;使用此方法学习无限维潜在码,实现半监督图像分类的最优结果,并通过下游任务的表现比较与其他方法的学习表示质量。
May, 2021
本文介绍了扩散模型领域的现状,并提出了改进现有问题的技术,包括模型速度提升、数据结构多样化、可能性优化和维数减少等。此外,还介绍了扩散模型的应用,包括计算机视觉、序列建模、音频和科学人工智能。
Sep, 2022
本文对自然语言处理中的扩散模型进行了全面的综述,讨论了不同的模型形式、优势和局限性,以及自然语言生成、情感分析、主题建模和机器翻译等应用。与自回归模型相比,扩散模型具有在生成、插值、令牌级控制和鲁棒性方面的显着优势。未来的研究方向包括把 Transformers 和扩散模型更深层次的结合,发展具有优秀的 few-shot learning 能力的多模态扩散模型和大规模扩散语言模型。
May, 2023