深度量化:用深度生成模型编码卷积激活
该研究利用基于期望最大化算法的训练技术提高 VQ-VAE 模型在 CIFAR-10 数据集上的图像生成结果,并通过知识蒸馏技术,开发出一种非自回归机器翻译模型,其准确性几乎与强贪婪自回归基线变压器相当,但在推理速度上快 3.3 倍。
May, 2018
本研究旨在结合卷积神经网络和 Fisher Vector 编码策略,将 Fisher Vector 编码策略作为一个可训练的端到端可微的系统的一部分,并命名为 FisherNet,该方法优于传统卷积神经网络和标准 Fisher Vector 方法,在 PASCAL VOC 目标分类任务中获得了更好的分类准确性和计算效率。
Jul, 2016
本文探讨矢量量化变分自编码器模型 (VQ-VAE) 进行大规模图像生成的应用,采用自回归先验信息,结合简单前馈编码器和解码器网络,以压缩的潜变量空间进行自动回归模型采样,同时使用多尺度层级 VQ-VAE 进行生成,取得比 Generative Adversarial Networks 更加优秀的样本生成品质。
Jun, 2019
该研究提出了一种名为 DeepCoder 的半参数建模框架,将参数化(卷积)和非参数化 (序数 GPs) VAE 的建模能力结合起来,用于多层次任务层次结构的潜在表示和多个序数输出的分类的联合学习,该模型在 AU 强度估计的基准数据集上表现出超越最先进方法和相关 VAE 和深度学习模型的优势。
Apr, 2017
本研究提出了一种新颖的方法来构建变分自编码器 (Variational Autoencoder,VAE), 该方法通过 enforced deep feature consistency 的方式替代了传统的像素级别的损失,以充分保留输入数据的空间相关性,产生更自然的视觉效果和更好的感知质量。 对 CelebA 数据集的测试结果表明,我们模型能够优于其他文献中的方法,并且还能够产生能捕捉面部表情语义信息的潜在向量,这些向量可用于实现面部属性预测的最新性能。
Oct, 2016
我们提出了一种新颖的算法来量化训练模型中的连续潜在表达式,该算法适用于深度概率模型,可以实现数据和模型压缩,并且可以基于后验不确定性使用自适应量化精度来实现可变的码率失真折衷,实验证明了所提出的算法的有效性。
Feb, 2020
提出了一种用于图像生成的深度分层变分自编码器(NVAE),其使用深度分离卷积和批归一化。NVAE 在 MNIST、CIFAR-10、CelebA 64 和 CelebA HQ 数据集上取得了最先进的结果,并为 FFHQ 提供了强大的基准。NVAE 是最成功的 VAE 应用于自然图像,尺寸达到了 256x256 像素。
Jul, 2020
本文提出了一种基于深度神经网络的变分自编码器,使用实值非体积保存变换来准确计算数据的条件似然,采用由少量中间层组成的强大条件耦合层来使其学习效果更好,在图像建模任务上有着不错的表现。
Nov, 2016