本文提出了一种基于变分自编码器和神经自回归模型的简单但原则性的方法来学习全局表示,该方法允许对全局潜在特征进行控制,通过设计相应的架构,可以迫使全局潜在特征丢弃 2D 图像纹理等无关信息,并且通过利用自回归模型作为潜在分布和解码分布,可以大大提高 VAE 的生成建模性能,实现了 MNIST、OMNIGLOT 和 Caltech-101 Silhouettes 密度估计任务的新的最先进结果。
Nov, 2016
本研究论文提出并验证了一种使用基于变分自编码器的可端到端训练模型的图像压缩方法,其中使用了超先验来有效地捕获潜在表示中的空间依赖关系,证明该模型在使用 MS-SSIM 指标度量视觉质量时具有最先进的图像压缩性能,并提供了不同失真度指标的不同训练模型之间的定性比较。
Feb, 2018
本文提出了一种基于无监督学习、从神经科学中获得灵感的方法,利用变分自编码器对图像数据进行学习,从而获得解耦表示。该方法可以使神经科学的研究成果得以应用到实际中,同时还有零样本推理和直观理解的优点。
Jun, 2016
本篇论文提出了一种基于变分自动编码器框架的概念模型,其设计旨在具有诸如分解的概念域等吸引人的属性,同时可以从数据中进行学习;该模型被称为 “概念 VAE”,能够从简单的彩色形状图像及其对应的概念标签中学习可解释的概念表示,并可用作概念分类器。同时,将该模型从标签少的实例中进行学习来进行适应,最后用高斯分布统计方法对模型进行形式化建模,并与 Gardenfors 的概念空间理论相关联。
Mar, 2022
本文研究了利用深度潜变量模型进行有损图像压缩的问题,并提出了迭代推理、离散优化的随机退火以及 bits-back 编码等方法,取得了新的最优表现。
Jun, 2020
本文介绍了一种基于块的端到端自编码器图像压缩系统,其主要贡献包括模拟二值化、多网络可变比特率、熵友好表示、推理阶段代码优化和性能优化归一化层。我们评估并展示了每个贡献的增量性能提高。
May, 2018
本文提出了一种训练程序,它基于辅助损失函数来控制潜变量所捕获的信息以及留给自回归解码器的信息,该方法可以实现任意强大的自回归解码器,达到具有潜变量的模型中最先进的定量性能,并生成定性令人信服的样本。
Nov, 2017
神经图像压缩可以通过使用变分自动编码器和随机 Gumbel 退火来优化编码器和解码器容量,从而提高压缩性能。
Jan, 2024
使用 Variational Homoencoder(VHE)技术,在 Omniglot 数据集中建立层次化的 PixelCNN,其效果优于所有现有模型,同时在一次性生成和分类任务上实现强大性能。
Jul, 2018
本文提出了一种基于可逆神经网络(INNs)的 Invertible Encoding Network 方法来构建更好的图像空间和潜在特征空间之间的转换,并在 Kodak、CLIC 和 Tecnick 数据集上证明了该方法在高分辨率图像方面优于现有的学习图像压缩方法和压缩标准(包括 VVC (VTM 12.1))的实验结果。
Aug, 2021