深度量化：用深度生成模型编码卷积激活

Nov, 2016

深度量化：用深度生成模型编码卷积激活

Deep Quantization: Encoding Convolutional Activations with Deep Generative Model

Zhaofan Qiu, Ting Yao, Tao Mei

TL;DR该论文提出了一种基于 Fisher 向量与变分自编码器的深层架构，用于将卷积层的本地激活量化为深度生成模型，并在三个公共数据集上进行广泛实验，取得了比现有最先进方法更好的结果。

Abstract

Deep convolutional neural networks (CNNs) have proven highly effective for visual recognition, where learning a universal representation from activations of convolutional layer plays a fundamental problem. In this paper, we present →

convolutional neural networks fisher vector encoding variational auto-encoder generative models video action recognition

发现论文，激发创造

神经离散表征学习

本文提出了一种简单而强大的生成模型，学习离散表示，可以生成高质量的图像、视频和语音，同时进行说话人转换和音素无监督学习。

Nov, 2017

向量量化自编码器的理论与实验

该研究利用基于期望最大化算法的训练技术提高 VQ-VAE 模型在 CIFAR-10 数据集上的图像生成结果，并通过知识蒸馏技术，开发出一种非自回归机器翻译模型，其准确性几乎与强贪婪自回归基线变压器相当，但在推理速度上快 3.3 倍。

May, 2018

深度 FisherNet 目标分类

本研究旨在结合卷积神经网络和 Fisher Vector 编码策略，将 Fisher Vector 编码策略作为一个可训练的端到端可微的系统的一部分，并命名为 FisherNet，该方法优于传统卷积神经网络和标准 Fisher Vector 方法，在 PASCAL VOC 目标分类任务中获得了更好的分类准确性和计算效率。

Jul, 2016

利用 VQ-VAE-2 生成多样高保真度图像

本文探讨矢量量化变分自编码器模型 (VQ-VAE) 进行大规模图像生成的应用，采用自回归先验信息，结合简单前馈编码器和解码器网络，以压缩的潜变量空间进行自动回归模型采样，同时使用多尺度层级 VQ-VAE 进行生成，取得比 Generative Adversarial Networks 更加优秀的样本生成品质。

Jun, 2019

DeepCoder：用于自动面部动作编码的半参数变分自编码器

该研究提出了一种名为 DeepCoder 的半参数建模框架，将参数化（卷积）和非参数化 (序数 GPs) VAE 的建模能力结合起来，用于多层次任务层次结构的潜在表示和多个序数输出的分类的联合学习，该模型在 AU 强度估计的基准数据集上表现出超越最先进方法和相关 VAE 和深度学习模型的优势。

Apr, 2017

深度特征一致性变分自编码器

本研究提出了一种新颖的方法来构建变分自编码器 (Variational Autoencoder，VAE), 该方法通过 enforced deep feature consistency 的方式替代了传统的像素级别的损失，以充分保留输入数据的空间相关性，产生更自然的视觉效果和更好的感知质量。对 CelebA 数据集的测试结果表明，我们模型能够优于其他文献中的方法，并且还能够产生能捕捉面部表情语义信息的潜在向量，这些向量可用于实现面部属性预测的最新性能。

Oct, 2016

分层量化自编码器

该研究使用层次 VQ-VAE 近似压缩图像，同时保持感知质量和抽象特征。在 CelebA 和 MNIST 数据集上进行了定性和定量评估。

Feb, 2020

变分贝叶斯量化

我们提出了一种新颖的算法来量化训练模型中的连续潜在表达式，该算法适用于深度概率模型，可以实现数据和模型压缩，并且可以基于后验不确定性使用自适应量化精度来实现可变的码率失真折衷，实验证明了所提出的算法的有效性。

Feb, 2020

NVAE: 深度分层变分自编码器

提出了一种用于图像生成的深度分层变分自编码器（NVAE），其使用深度分离卷积和批归一化。NVAE 在 MNIST、CIFAR-10、CelebA 64 和 CelebA HQ 数据集上取得了最先进的结果，并为 FFHQ 提供了强大的基准。NVAE 是最成功的 VAE 应用于自然图像，尺寸达到了 256x256 像素。

Jul, 2020

深度变分推断无需像素级重构

本文提出了一种基于深度神经网络的变分自编码器，使用实值非体积保存变换来准确计算数据的条件似然，采用由少量中间层组成的强大条件耦合层来使其学习效果更好，在图像建模任务上有着不错的表现。

Nov, 2016