Apr, 2024

多对多图像生成与自回归扩散模型

TL;DR这篇论文介绍了一种领域通用的多对多图像生成框架,能够从给定的图像集合中生成相互关联的图像系列,并提供可扩展的解决方案,无需在不同的多图像场景中使用任务特定的解决方案。利用MIS数据集,该方法使用稳定扩散和不同的潜在噪声从单个标题生成一组相互关联的图像。通过在MIS数据集上进行训练,该模型能够捕捉到先前图像(合成或真实)的风格和内容,并生成遵循这些模式的新图像。此外,通过任务特定的微调,我们的模型展示了其适应各种多图像生成任务的能力,包括新视角合成和视觉流程生成。