分层扩散自编码器与分离图像操作

Apr, 2023

分层扩散自编码器与分离图像操作

Hierarchical Diffusion Autoencoders and Disentangled Image Manipulation

Zeyu Lu, Chengyue Wu, Xinyuan Chen, Yaohui Wang, Yu Qiao...

TL;DR本论文提出了一种通过使用分层扩散自动编码器 (HDAE) 以及基于截断特征的方法对扩散模型潜空间进行描述，从而实现对图像的多种操作和语义合成。

Abstract

diffusion models have attained impressive visual quality for image synthesis. However, how to interpret and manipulate the latent space of

diffusion models latent space hierarchical diffusion autoencoders disentangled manipulation image synthesis

发现论文，激发创造

DiffuseGAE：通过解耦表示的可控高保真图像操作

本篇研究介绍 Diff-AE 与 GAE 两种基于 Diffusion probabilistic models 的编码器模型，实现由多个属性进行图像编辑和生成，大大降低了计算需求，并达到了相当不错的效果，对潜在特征得到了更好的分离。

Jul, 2023

使用潜在扩散模型进行高分辨率图像合成

通过在预训练的自编码器的潜在空间中应用扩散模型，引入交叉注意力层到模型体系结构中，以更少的计算要求取得接近最优的性能，实现高分辨率合成，缩小像素级 DMs 对计算资源的需求。

Dec, 2021

复杂性的重要性：重新思考生成建模的潜空间

本研究探讨了生成建模中潜在空间选择的最优解以及其确定过程，并提出了一种新的距离度量方法和具体的训练策略来优化潜在空间的选择，进而提高生成效果。

Jul, 2023

图像编辑的紧凑且语义潜空间的解缠和可控

我们提出了一种自编码器方法，通过重新组织 StyleGAN 的潜空间，使我们希望编辑的每个属性对应于新潜空间的一个轴，同时确保潜空间轴之间的相关性降到最低，以促进属性解缠，通过实验证明了我们的方法在编辑能力上超越了竞争方法，同时在保持图像身份一致性方面与原始图像具有高度的准确性，我们的自编码器结构简单明了，易于实现。

Dec, 2023

DiffuseVAE: 从低维潜变量中高效、可控、高保真生成

提出了一种新的生成框架 DiffuseVAE，它将 VAE 与扩散建模框架相结合，为扩散模型提供了低维的 VAE 学习到的潜在代码，从而能够用于控制合成等下游任务，并且在速度与质量的平衡方面比标准无条件 DDPM / DDIM 模型要好，同时表现出与最先进的模型可比的综合质量，还显示出天生的对不同类型的噪声具有泛化能力。

Jan, 2022

扩散自编码器：走向有意义和可解码的表征

本研究探索使用可扩散概率模型作为自编码器的解码器，让输入图像生成一个可以被意义化和解码的编码向量，该编码向量分为两部分：第一部分是含有语义的线性编码，而第二部分是建模随机变量的编码，提升了图像生成的质量并且在其他应用中可以用来做属性调整和去噪等任务。

Nov, 2021

通过去噪引导潜在表示的文本自编码器教育

本文介绍了一种通过利用生成自编码器的潜在句子表示来实现可控制文本生成的方法。作者提出了一种改进自动编码器的方法，被称为 DAAE，该方法可以在维持生成质量的同时，提高模型中的潜在空间几何性，从而实现了通过简单潜在向量算术进行全零文本风格转换。

May, 2019

通过扩散模型和组自编码超分辨率网络增强高光谱图像

提出了一种新的 Group-Autoencoder (GAE) 框架，并与扩散模型结合，构建了一个高效的高光谱图像超分辨率模型 (DMGASR)。实验证明，该方法在视觉上和指标上优于其他最先进的方法。

Feb, 2024

预训练扩散概率模型中的无监督表征学习

本文提出了一种基于现有预训练 DPM 模型的图像重建通用方法 PDAE，实现了比 Diff-AE 更好的训练效率和性能，并通过对分类器引导采样的机制填补信息缺失的空隙，使编码器对图像进行更好的重建，表现出了较高的有效性、效率和灵活性。

Dec, 2022

ViT-DAE：基于 Transformer 的扩散自编码器用于组织病理学图像分析

本文介绍了一种基于 ViT 深度学习模型和 Denoising Diffusion 自编码器的新型方法 ViT-DAE，用于高质量的组织病理学图像合成，实验表明 ViT-DAE 比最近的基于 GAN 和原始 DAE 方法更能生成逼真的图像。

Apr, 2023