基于条件 IMLE 的语义布局多样的图像合成
本文提出了基于 IMLE 的新型多模式条件图像合成方法,并在两个任务中演示了更好的多模式图像合成性能,即单幅图像超分辨率和从场景布局中的图像合成。
Apr, 2020
本文提出了一种从语义类分布的角度来支持语义或实例级别多样性生成的多样语义图像合成框架,包括条件调制参数和噪声重映射,并在多个数据集上取得了良好的效果。
Mar, 2021
提出利用语义布局来综合生成逼真图像的新方法,该方法建立了区域之间的依赖关系并通过动态加权网络实现,既保留了语义区分,同时加强了语义相关性,提高了全局结构和细节的合成质量。
Sep, 2021
介绍了一种基于图像反演的方法 --IMAge-Guided model INvErsion(IMAGINE),通过匹配经过训练的分类器中的多层特征表示和外部鉴别器的对抗训练,来从单一训练样本生成高质量和多样化的图像,实现了在维持语义特性约束的同时生成逼真图像,并且可以让用户直观地控制生成过程。经过大量实验证明,在对象、场景和纹理这三个不同的图像域中,IMAGINE 都比现有的基于 GAN 或基于反演的方法表现更好。
Apr, 2021
Layout2Im 是一种基于布局的图像生成方法,将物体表示分解为指定和不确定部分,并使用卷积 LSTM 编码并解码整个布局,以生成准确且多样化的图像,提高了最佳 Inception 分数 24.66%至 28.57%。
Nov, 2018
本文提出了一种基于变分自编码器的类别和层次的扩展方法,能够通过学习多个潜在空间在本地和全局水平上灵活地控制每个对象类别以处理确定对象样式的各种因素,生成的图像在真实数据集、合成数据集三个不同领域的广泛实验中都表现出更加合理、更具多样性的特点,可用于图像合成和编辑任务。
Jun, 2021
本文提出了一种基于图像扩散模型的语义图像合成方法,通过引入随机噪声和逐渐去噪的方式,以分割掩模为指导生成高质量图像,并进一步通过细化、颜色转移和模型集成等技术提高合成质量。大量实验证明本方法在性能上明显超越了现有的最先进方法。
Mar, 2024
本研究评估了基于扩散、基于 GAN 和基于 IMLE 的方法在三个反向问题上的性能,即 16 倍超分辨率、着色和图像解压。总体上,我们发现基于 IMLE 的 CHIMLE 方法在提供有效解决方案和可靠的不确定性估计方面优于其他方法。
Dec, 2023
通过在生成器中条件化卷积核以更好地利用语义布局,提出一种特征金字塔语义嵌入判别器的多尺度生成对抗网络方法,该方法在各种语义分割数据集上实现了优秀的量化指标和主观评估。
Oct, 2019
本文提出了一种新颖的端到端 3D 感知图像生成和编辑模型,通过纯噪声、文本和参考图像等多种条件输入,在 3D 生成对抗网络(GANs)的潜在空间中深入研究并提出解缠特性较好的生成策略,同时采用统一框架进行灵活的图像生成和编辑任务,实现多模态条件下的多样图像生成、属性编辑和风格迁移。广泛实验证明,该方法在图像生成和编辑方面在质量和数量上均优于替代方法。
Mar, 2024