通过在预训练的自编码器的潜在空间中应用扩散模型,引入交叉注意力层到模型体系结构中,以更少的计算要求取得接近最优的性能,实现高分辨率合成,缩小像素级DMs对计算资源的需求。
Dec, 2021
通过给扩散模型输入精制的噪声来提高其控制性,从而可以产生基于语义属性的图像。
May, 2022
本综述为关于应用于计算机视觉的去噪扩散模型文章提供了全面的回顾,包括在领域中的理论和实际贡献,提供了三种通用扩散建模框架,并介绍了扩散模型与其他深度生成模型之间的关系,并引入了在计算机视觉中应用扩散模型的多个视角分类,最后,我们说明了离散模型的当前限制并预见了未来研究的一些有趣方向。
Sep, 2022
通过图像条件实现的一种新颖的有条件蒸馏方法,将扩散模型的先验知识与图像条件相结合,大大简化了以往两阶段的蒸馏过程,并通过少量的额外参数和冻结的无条件主干网络实现了一种新的高效蒸馏机制,实验结果表明,该方法在多个任务上的表现优于现有的人工蒸馏技术,并且是第一个能够与更慢的精细调优有条件扩散模型相匹配的蒸馏策略。
Oct, 2023
通过经验分析,我们提出了一套方法,以降低在扩散模型中引入指导所带来的时间需求和计算开销,并且保持相当的图像质量,从而将计算时间减少大约三倍。
Dec, 2023
调查论文对使用扩散模型进行图像编辑的现有方法进行了全面的概述,包括理论和实践方面,并从多个角度对这些作品进行了彻底分析和分类,介绍了学习策略、用户输入条件以及可以实现的特定编辑任务的组合。此外,对图像修复和扩展进行了特别关注,并探讨了早期的传统上下文驱动方法和当前的多模态条件方法,全面分析了它们的方法论。最后,讨论当前的限制并展望未来的研究方向。
Feb, 2024
在控制生成方面与文本到图像扩散模型的研究领域,通过调查文献并总结了控制性生成,包括基本概念和实践研究。
Mar, 2024
这篇综述论文全面地评估了扩散模型技术,并探讨了它们与其他深度生成模型的相关性,建立了理论基础。同时,该论文还总结了扩散模型在医学、遥感和视频等领域应用的情况,提供了常用基准和评估指标的概述,以及针对三个主要任务的扩散模型技术的全面评估。最后,作者指出当前扩散模型的局限性,并提出了未来研究的七个有趣方向。这篇综述论文旨在加深人们对于在低层次视觉任务中的去噪扩散模型领域的全面理解。
Jun, 2024
本研究针对条件图像合成领域中的复杂性及多样性挑战,系统性地回顾了基于扩散的生成建模方法。通过对现有研究的分类,本论文揭示了多种条件机制在模型训练和采样过程中的应用,指出了关键问题与未来研究方向,助于研究者更好地理解和应对快速发展的条件图像合成技术。
Sep, 2024
本研究解决了条件生成中的复杂性问题,提出了一种简单、统一的框架来处理不同的条件生成任务。通过利用扩散模型学习图像对的联合分布,该方法在推理阶段支持多种生成和估计方式,实现了灵活可控的图像生成。实验结果表明,该模型在性能上可以与专门方法相媲美,并且优于以往的统一方法。
Oct, 2024