本综述为关于应用于计算机视觉的去噪扩散模型文章提供了全面的回顾,包括在领域中的理论和实际贡献,提供了三种通用扩散建模框架,并介绍了扩散模型与其他深度生成模型之间的关系,并引入了在计算机视觉中应用扩散模型的多个视角分类,最后,我们说明了离散模型的当前限制并预见了未来研究的一些有趣方向。
Sep, 2022
本文提出了一种基于扩散算法生成图像的模型,将前向热方程的解释为噪声后的扩散潜变量模型的变分近似。其具有整体颜色和形状解耦的性质,同时通过自然图像上的谱分析,揭示了其暗含的自上而下的归纳偏置。
Jun, 2022
通过改变图像退化处理方法,可以构建一系列生成模型,并且即使使用完全确定性的退化方法,也可以轻松推广扩展扩散模型的训练和测试时间更新规则,为翻转任意过程的扩散模型打下基础,这一成功也质疑了该社区对扩散模型的理解。
Aug, 2022
生成扩散模型的理论发展主要分为两种方法,基于训练和基于采样,将这些方法明确分类为研究者未来进行新发展提供清晰可理解的方向。
Apr, 2024
通过在模型训练过程中加入约束条件使其生成的样本更符合所施加的约束,从而提高生成样本与约束的一致性,且相较于现有方法有更好的性能且不影响推断速度;该方法还可以自然地防止过拟合。
Mar, 2024
生成工具的惊人增长赋予了文本向图像生成和文本向视频生成等许多令人兴奋的应用,这些生成工具的底层原理是扩散概念,一种克服了以前方法中困难的特定抽样机制。本教程旨在讨论扩散模型的基本思想,目标受众包括对扩散模型进行研究或将其应用于解决其他问题的本科和研究生学生。
这篇综述论文全面地评估了扩散模型技术,并探讨了它们与其他深度生成模型的相关性,建立了理论基础。同时,该论文还总结了扩散模型在医学、遥感和视频等领域应用的情况,提供了常用基准和评估指标的概述,以及针对三个主要任务的扩散模型技术的全面评估。最后,作者指出当前扩散模型的局限性,并提出了未来研究的七个有趣方向。这篇综述论文旨在加深人们对于在低层次视觉任务中的去噪扩散模型领域的全面理解。
Jun, 2024
量子驱动扩散模型的量子泛化被提出,并讨论了可在实际量子系统上进行实验测试的三种量子噪声驱动的生成扩散模型。通过利用量子噪声作为生成更复杂的概率分布的重要成分,我们的结果有望为处理从气候预测到神经科学、交通流分析到金融预测等广泛的实际应用任务的新型量子驱动生成扩散算法铺平道路。
Aug, 2023
本研究提出了一种基于扩散模型的任意时间图像生成方法,使用两个嵌套扩散过程进行快速迭代细化,并允许根据用户的瞬时偏好进行灵活调度。在 ImageNet 数据集和稳定扩散的文本到图像生成实验中,我们显示了我们的中间生成质量大大超过原始扩散模型,同时最终缓慢的生成结果仍然可比较。
May, 2023
扩展图像生成文献中的扩散模型框架以适应语音增强任务,通过探究扩散模型的设计方面,如神经网络预处理、训练损失权重、随机微分方程和反向过程中注入的随机性量,证明了先前的扩散模型语音增强系统的性能并非归因于干净和嘈杂信号之间的渐进转化,并表明适当的预处理、训练损失权重、随机微分方程和采样器选择可以在感知度度量方面优于流行的扩散模型语音增强系统,并减少约四分之一的计算成本。
Dec, 2023