有限数据下的图像合成:调查与分类
概率生成模型评估标准的独立性存在着许多亟需关注的性质,本文重点评估了影像模型,阐明对于高维数据当前最常用的三个标准,即平均对数似然、Parzen窗口估计和样本视觉保真度,这些几乎是相互独立的;因此,好的表现不一定意味着好的其他标准的表现,在评估生成模型的性能时需要针对其预期应用直接进行评估,并且通常应避免使用Parzen窗口方法。
Nov, 2015
研究了从黑盒生成模型而不是数据直接学习通用视觉表达式的设置,通过该生成器的样本输出训练,比较了几种可应用于该设置的表征学习方法,使用生成器的潜空间来生成相同语义内容的多个“视图”,表明多视图数据可以自然地用于识别正面对和负面对。
Jun, 2021
通过探索条件生成模型的新的形式和在图像、3D动画和视频中的创新应用,本论文试图在计算机视觉领域推动创新。我们的研究聚焦于提供噪声和视觉数据的可逆变换的体系结构,并应用编码器-解码器结构进行生成任务和3D内容操作。在所有情况下,我们都将条件信息纳入生成过程中,以提高视觉数据的合成效率和生成内容的质量。
Oct, 2023
通过预训练的稳定扩散模型,基于个性化文本到图像模型Dreambooth,我们的研究发现视图概念可以被学习和分离,并通过少量示例迁移到新对象,我们引入了一种名为FSViewFusion的学习策略,通过单个场景的一张图像样本来传递视图的知识,通过低秩适配器在少量样本上学习新对象,通过大量实验证明我们的方法能够在野外图像中生成可靠的视图样本。
Mar, 2024
LlamaGen是一种新型的图像生成模型家族,采用大型语言模型中的原始“下一个标记预测”范例应用于视觉生成领域,不附带对视觉信号的归纳偏见,可以在适当缩放的情况下实现最先进的图像生成性能。
Jun, 2024
本研究针对条件图像合成领域中的复杂性及多样性挑战,系统性地回顾了基于扩散的生成建模方法。通过对现有研究的分类,本论文揭示了多种条件机制在模型训练和采样过程中的应用,指出了关键问题与未来研究方向,助于研究者更好地理解和应对快速发展的条件图像合成技术。
Sep, 2024
本研究针对条件图像合成的复杂性与快速发展的挑战,系统性地分类现有文献,探讨条件如何融入扩散模型的去噪网络和采样过程。研究的关键在于分析各种条件方法在训练及专业化阶段的原理和优缺点,并总结六种主流条件机制。该综述不仅为研究者提供了深入的理解,也指出了未来亟待解决的关键问题和潜在的解决方案。
Sep, 2024