高效VDVAE：少即是多

Mar, 2022

Efficient-VDVAE: Less is more

Louay Hazami, Rayhane Mama, Ragavan Thurairatnam

TL;DR通过对Very Deep VAE（变分自编码器）的改进，我们实现了比现有技术更快速、性能更好且更加稳定的Hierarchical VAE，并发现仅使用其潜在空间空间的约3%即可编码大部分图像信息，为下游任务提供了高效利用的方式。

Abstract

hierarchical vaes have emerged in recent years as a reliable option for maximum likelihood estimation. However, instability issues and demanding computational requirements have hindered research progress in the area. We present simple modifications to the →

发现论文，激发创造

PixelVAE：自然图像的潜变量模型

这篇论文提出了PixelVAE，这是一种基于PixelCNN的VAE模型，可以高效地捕获大型结构和保留压缩的潜在表示，适用于无监督学习的挑战。

Nov, 2016

变分自编码器中落后的推断网络和后验崩溃

本文研究了变分自编码器(VAE)在训练时出现的后验崩溃现象。针对训练动态的观察，我们提出了一种极其简单的改进VAE的训练方法，避免了之前工作中普遍存在的后验崩溃问题，并取得了比基准模型更优的实验结果。

Jan, 2019

利用VQ-VAE-2生成多样高保真度图像

本文探讨矢量量化变分自编码器模型(VQ-VAE)进行大规模图像生成的应用，采用自回归先验信息，结合简单前馈编码器和解码器网络，以压缩的潜变量空间进行自动回归模型采样，同时使用多尺度层级VQ-VAE进行生成，取得比Generative Adversarial Networks更加优秀的样本生成品质。

Jun, 2019

分层量化自编码器

该研究使用层次VQ-VAE近似压缩图像，同时保持感知质量和抽象特征。在CelebA和MNIST数据集上进行了定性和定量评估。

Feb, 2020

NVAE: 深度分层变分自编码器

提出了一种用于图像生成的深度分层变分自编码器（NVAE），其使用深度分离卷积和批归一化。NVAE在MNIST、CIFAR-10、CelebA 64和CelebA HQ数据集上取得了最先进的结果，并为FFHQ提供了强大的基准。NVAE是最成功的VAE应用于自然图像，尺寸达到了256x256像素。

Jul, 2020

用对比学习的方法训练变分自编码器先验

针对变分自编码器的先验洞问题，我们提出了一种能源化先验，通过基础先验分布和重新加权因子的乘积来定义，以使基础先验更接近集体后验，并通过噪声对比估计来训练重新加权因子，实验证明此方法可以大幅提高MNIST、CIFAR-10、CelebA 64和CelebA HQ 256数据集上的最先进VAE的生成性能。

Oct, 2020

极深的VAE可以推广自回归模型并在图像上优于它们

本文提出了具有层次结构的VAE，并且在所有自然图像基准上，它比PixelCNN更快地生成样本的同时在对数似然上表现更好。我们通过将VAE的随机深度比以前探索的更深来测试不足深度是否会导致VAE性能下降。与PixelCNN相比，这些非常深的VAE可以获得更高的似然度，使用更少的参数，更快地生成样本，并且对高分辨率图像更容易应用，这是因为VAE学习了高效的分层视觉表示。

Nov, 2020

有限数量的标量量化：简化VQ-VAE

我们提出使用有限数量标量量化（FSQ）替代VQ-VAEs中的向量量化（VQ），通过将VAE表示投影到少量维度中，并将每个维度量化为固定值的小集合，从而实现离散表示。我们在图像生成中使用MaskGIT，以及在深度估计、上色和全景分割中使用UViM，尽管FSQ的设计简单，但在这些任务中获得竞争性表现。我们强调FSQ不会出现代码本崩溃问题，也不需要复杂的机制来学习表达丰富的离散表示。

Sep, 2023

HQ-VAE：具有变分贝叶斯的分层离散表示学习

基于变分贝叶斯框架，提出一种新颖的统一框架，即分层量化变分自动编码器（HQ-VAE），其以离散表示形式随机学习层次化的离散特征，并解决了分层 VQ-VAE 中的代码本/层级坍塌问题，从而提高重建性能。

Dec, 2023

CV-VAE：潜在生成视频模型的兼容视频变分自编码器

我们提出了一个名为CV-VAE的视频VAE方法，通过与给定图像VAE进行潜在空间的兼容性来实现训练视频模型，并展示了其在视频生成和压缩方面的有效性。

May, 2024