PixelSNAIL: 一种改进的自回归生成模型
使用 LMConv 实现了生成模型的任意序列生成,可以用于图像完成等任务,在整体图像密度估计(2.89 bdp 无条件 CIFAR10)方面取得了改进的性能,同时实现了全局连贯图像完成。
Jun, 2020
本文介绍了一种深度神经网络模型,用于在两个空间维度上序列预测图像像素;该模型对图像的离散概率进行建模,并在深层循环网络中使用了快速的二维循环层和残差连接,实现了比以前的最新技术更好的自然图像日志似然度分数。
Jan, 2016
本文中介绍了一种基于多维 LSTM 的递归图像模型,该模型可以捕获长距离像素之间的统计依赖,适用于纹理合成和补全等多项任务,并在多个图像数据集上的定量比较中表现优异。
Jun, 2015
本研究提出了一种并行化的 PixelCNN 模型,将某些像素组建模为条件独立,实现了更高效的推理和生成,相比每像素逐一生成,采样速度从 O (N) 提升为 O (log N),实现了 512x512 图像的实用生成。在类条件图像生成、文本图像合成和动作条件视频生成等方面实现了最佳效果。
Mar, 2017
本论文探讨自然图像的概率模型,并通过引入辅助变量扩展了 PixelCNN 架构家族的自回归模型,提出了两个新的基于不同图像转换的生成式图像模型,包括图像的分辨率金字塔。该模型解决了现有 PixelCNN 模型的两个已知缺点,并表明其产生的图片样本更加真实。
Dec, 2016
本文介绍了 PixelGAN 自编码器,通过条件生成对抗网络并在潜变量编码上加入不同的先验分布从而对图像信息进行全局对比或局部对比,实现了样式和内容信息的自监督分离,并在 MNIST、SVHN 和 NORB 数据集上实现了竞争力的半监督分类结果。
Jun, 2017
提出使用离散表示图像的方法,可以让基于自回归的生成模型输出具备更好的大规模连贯性,在 ImageNet 数据集上进行实验,证明了分层条件自回归模型可以在 128×128 和 256×256 的分辨率上生成逼真的图像。
Mar, 2019
在这项工作中,我们将基于自我关注机制的模型架构 ——Transformer 模型,泛化到图像生成的序列建模问题上,并通过限制自我关注机制只关注局部邻域,显著提高了模型能够实际处理的图像大小,同时在图像生成方面显著优于当前最优秀的状态,提高了 ImageNet 上最佳公布的负对数似然从 3.83 到 3.77,同时还针对大放大倍数进行了图像超分辨率实验。在人类评估研究中,我们发现,我们超分辨率模型生成的图像比先前的最优模型更能欺骗人类观察者。
Feb, 2018
该研究提出了一种基于缓存隐藏状态避免冗余计算的方法来加速卷积自回归模型的生成,将其应用于 Wavenet 和 PixelCNN++ 模型可实现高达 21 倍和 183 倍的加速。
Apr, 2017