视觉中的生成人工智能:模型、度量和应用的综述
本文概述了 “扩散模型” 在图像合成、视频生成、分子设计等领域中的应用,并将相关研究分为三大类:高效采样、改进似然估计和处理具有特殊结构的数据。此外,还探讨了将扩散模型与其他生成模型相结合以获得更好结果的潜能,在计算机视觉、自然语言生成、时态数据模型等领域具有广泛的应用。本文旨在提供一个全面的扩散模型综述,指出其重点研究领域并指向未来的研究方向。
Sep, 2022
本文综述了文本到图像扩散模型的发展现状及其在生成任务中的应用;此外,介绍了文本条件下图像合成、文本引导的创意生成和图像编辑,并探讨了当前的挑战和未来方向。
Mar, 2023
生成人工智能是指生成合成但逼真的输出的算法。扩散模型在图像生成人工智能中目前达到最高水平,并在包括文本到图像生成器和大型语言模型在内的更通用工具中起着关键作用。
Dec, 2023
本文介绍了扩散模型领域的现状,并提出了改进现有问题的技术,包括模型速度提升、数据结构多样化、可能性优化和维数减少等。此外,还介绍了扩散模型的应用,包括计算机视觉、序列建模、音频和科学人工智能。
Sep, 2022
扩散模型是强大且通用的生成式人工智能技术,在计算机视觉、音频、强化学习和计算生物学等领域取得了巨大的成功。本文回顾了扩散模型的新兴应用,理解了它们在各种控制下的样本生成。同时,我们概述了现有的扩散模型理论,涵盖了它们的统计性质和采样能力。进一步地,我们评述了通过条件扩散模型进行高维结构化优化的新途径,将解决方案的搜索重新定义为条件采样问题,并通过扩散模型进行求解。最后,我们讨论了扩散模型的未来发展方向。本文旨在为刺激前瞻性的扩散模型理论和方法提供全面的理论介绍。
Apr, 2024
本论文总结了扩散模型在图像生成方面的成功,并介绍了扩散模型在图生成方面的应用,特别是从分子和蛋白质建模方面进行了重点讨论,并讨论了扩散模型在图结构数据中的新方向。
Feb, 2023
这篇综述论文全面地评估了扩散模型技术,并探讨了它们与其他深度生成模型的相关性,建立了理论基础。同时,该论文还总结了扩散模型在医学、遥感和视频等领域应用的情况,提供了常用基准和评估指标的概述,以及针对三个主要任务的扩散模型技术的全面评估。最后,作者指出当前扩散模型的局限性,并提出了未来研究的七个有趣方向。这篇综述论文旨在加深人们对于在低层次视觉任务中的去噪扩散模型领域的全面理解。
Jun, 2024
近期 AI 生成内容 (AIGC) 的浪潮在计算机视觉领域取得了巨大的成功,其中扩散模型在这一成就中发挥了至关重要的作用。本文在 AIGC 时代提供了对视频扩散模型的全面回顾,包括视频生成、视频编辑和其他视频理解任务的研究概述,并讨论了该领域面临的挑战以及未来的发展趋势。
Oct, 2023
视觉计算领域因生成人工智能的出现而快速发展,介绍了扩散模型的基本数学概念、稳定扩散模型的实现细节和设计选择,以及包括个性化、条件设定、反转等在内的这些生成人工智能工具的重要方面的综述。此外,它还对基于扩散的生成和编辑的迅速增长的文献进行了全面的概述,按照生成介质的类型进行分类,其中包括 2D 图像、视频、3D 对象、运动和 4D 场景。最后,我们讨论了可用的数据集、度量标准、开放性挑战和社会影响。这个综述为研究人员、艺术家和从业者提供了一个直观的起点来探索这个令人兴奋的主题。
Oct, 2023
本文调查了图扩散模型的进展,特别关注了其在 AI 生成内容方面的应用,主要是分子、蛋白质和材料设计。我们也讨论了评估该模型在图领域的存在挑战问题。
Apr, 2023