基于扩散的图像生成模型调查:问题及其解决方案
这篇综述论文提供了关于生成式 AI 扩散和传统模型的全面概述,主要介绍了它们的基本技术、在不同领域的应用以及所面临的挑战,旨在为研究人员和从业者提供全面了解,并激发未来在这个令人兴奋的人工智能领域的创新。
Feb, 2024
本文综述了文本到图像扩散模型的发展现状及其在生成任务中的应用;此外,介绍了文本条件下图像合成、文本引导的创意生成和图像编辑,并探讨了当前的挑战和未来方向。
Mar, 2023
利用定性和定量指标以及用户研究,本论文主要研究了生成模型在面部图像生成中的有效性和不足之处,并提出了一个框架来审核生成的面部图像的特征。通过对最先进的文本到图像扩散模型生成的面部进行应用,我们发现面部图像生成存在的限制包括对文本提示的忠实度、人口统计不平衡和分布偏移。此外,我们还提出了一种分析模型,以了解训练数据选择如何影响生成模型的性能。
Sep, 2023
本文概述了 “扩散模型” 在图像合成、视频生成、分子设计等领域中的应用,并将相关研究分为三大类:高效采样、改进似然估计和处理具有特殊结构的数据。此外,还探讨了将扩散模型与其他生成模型相结合以获得更好结果的潜能,在计算机视觉、自然语言生成、时态数据模型等领域具有广泛的应用。本文旨在提供一个全面的扩散模型综述,指出其重点研究领域并指向未来的研究方向。
Sep, 2022
本文研究了图像扩散模型,如 DALL-E 2,Imagen 和 Stable Diffusion,发现它们从训练数据中记忆单个图像并在生成时发射此类图像,总结了此类模型的隐私风险和影响隐私保护培训的新进展。
Jan, 2023
视觉计算领域因生成人工智能的出现而快速发展,介绍了扩散模型的基本数学概念、稳定扩散模型的实现细节和设计选择,以及包括个性化、条件设定、反转等在内的这些生成人工智能工具的重要方面的综述。此外,它还对基于扩散的生成和编辑的迅速增长的文献进行了全面的概述,按照生成介质的类型进行分类,其中包括 2D 图像、视频、3D 对象、运动和 4D 场景。最后,我们讨论了可用的数据集、度量标准、开放性挑战和社会影响。这个综述为研究人员、艺术家和从业者提供了一个直观的起点来探索这个令人兴奋的主题。
Oct, 2023
生成工具的惊人增长赋予了文本向图像生成和文本向视频生成等许多令人兴奋的应用,这些生成工具的底层原理是扩散概念,一种克服了以前方法中困难的特定抽样机制。本教程旨在讨论扩散模型的基本思想,目标受众包括对扩散模型进行研究或将其应用于解决其他问题的本科和研究生学生。
Mar, 2024