PixelPyramids: 从无损图像金字塔中精确推理的模型
本研究提出了一种并行化的PixelCNN模型,将某些像素组建模为条件独立,实现了更高效的推理和生成,相比每像素逐一生成,采样速度从O(N)提升为O(log N),实现了512x512图像的实用生成。在类条件图像生成、文本图像合成和动作条件视频生成等方面实现了最佳效果。
Mar, 2017
研究了利用提升推理算法应用于计算机视觉中并开发了一种通用模板,其中采用了粗糙到精细的推理方法来提高算法的效率,成功地开发了用于立体视觉和交互式图像分割的基于提升推理算法的算法。
Jul, 2017
本文介绍了一种将因果卷积与自注意力相结合的新型生成模型,将其应用于密度估计任务,并在 CIFAR-10 和 ImageNet 上取得了最先进的结果。
Dec, 2017
本论文提出了一种基于Subscale Pixel Network和Multidimensional Upscaling的方法,可用于生成高保真度的大规模图像,并在CelebAHQ和ImageNet的数据集上取得了最先进的结果。
Dec, 2018
提出使用离散表示图像的方法,可以让基于自回归的生成模型输出具备更好的大规模连贯性,在ImageNet数据集上进行实验,证明了分层条件自回归模型可以在128×128和256×256的分辨率上生成逼真的图像。
Mar, 2019
本文研究了基于自回归模型与多项式扩散过程结合的粗粒度到细粒度的图像语境建模方法,该方法应用于图像修改技术,较单一自回归模型在高保真度生成和图像修改能力方面有着显著提高。同时,该模型可以在压缩的潜在空间下进行高效训练,能够对于无限制的用户提供的掩模进行图像修改,可解决自由形式图像修补和本地、文本引导的图像修改问题,无需特定的训练。
Aug, 2021
Pyramid Diffusion Model (PDM)通过金字塔潜在表示提供了更广泛的设计空间,以实现超高分辨率图像合成,结合空间通道注意力和Res-Skip连接,以及谱范数和递减的Dropout策略,使得PDM在生成任务方面具有更强的能力,首次成功合成了2K分辨率的图像。
Mar, 2024