深度变分推断无需像素级重构
这篇论文提出了 PixelVAE,这是一种基于 PixelCNN 的 VAE 模型,可以高效地捕获大型结构和保留压缩的潜在表示,适用于无监督学习的挑战。
Nov, 2016
提出了一种用于图像生成的深度分层变分自编码器(NVAE),其使用深度分离卷积和批归一化。NVAE 在 MNIST、CIFAR-10、CelebA 64 和 CelebA HQ 数据集上取得了最先进的结果,并为 FFHQ 提供了强大的基准。NVAE 是最成功的 VAE 应用于自然图像,尺寸达到了 256x256 像素。
Jul, 2020
本文提出了一种层次非参数变分自编码器模型,以结合树状结构的贝叶斯非参数先验和变分自编码器来实现无限灵活性的潜在表征空间,进而在视频表征学习上取得更好的效果。
Mar, 2017
本研究提出了一种新颖的方法来构建变分自编码器 (Variational Autoencoder,VAE), 该方法通过 enforced deep feature consistency 的方式替代了传统的像素级别的损失,以充分保留输入数据的空间相关性,产生更自然的视觉效果和更好的感知质量。 对 CelebA 数据集的测试结果表明,我们模型能够优于其他文献中的方法,并且还能够产生能捕捉面部表情语义信息的潜在向量,这些向量可用于实现面部属性预测的最新性能。
Oct, 2016
PixelVAE++ 是一种结合了 VAE 和 PixelCNN++ 的新型生成模型,可在保留潜变量信息的同时学习图像的全局和局部结构,并在 MNIST、Omniglot、CIFAR-10 数据集中实现了最先进的性能。
Aug, 2019
介绍了 Adversarial Variational Bayes 技术,可以用于训练具有任意表达力的推理模型的变分自编码器,并将其与生成对抗网络建立起了原则上的联系。
Jan, 2017
本文提出了一种新的变分自编码模型优化标准,推广了标准的证据下界,提供了它们恢复数据分布和学习潜在特征的条件,并在形式上证明了通常出现模糊样本和无信息潜在特征等常见问题的条件。基于这些新的见解,我们提出了一种新的序列化 VAE 模型,可以基于像素逐一重构损失在 LSUN 图像数据集上生成清晰的样本,并提出一种旨在鼓励无监督学习信息潜在特征的优化标准。
Feb, 2017
本文提出了一种基于层次结构的潜变量模型来提高模型表达能力,减少模糊预测,用于视频序列的未来帧预测任务,经过实验证明本方法在不同数据集上优于现有的潜变量模型。
Apr, 2019
本文提出了一种正则化方法来强制 Variational Auto-Encoder 的一致性,通过最小化 Kullback-Leibler(KL)散度来实现;实验结果表明该方法可以改善学习表征的质量并提高其泛化能力。
May, 2021
本文探讨矢量量化变分自编码器模型 (VQ-VAE) 进行大规模图像生成的应用,采用自回归先验信息,结合简单前馈编码器和解码器网络,以压缩的潜变量空间进行自动回归模型采样,同时使用多尺度层级 VQ-VAE 进行生成,取得比 Generative Adversarial Networks 更加优秀的样本生成品质。
Jun, 2019