利用空间LSTMs生成图像模型
该研究提出了一种基于深度卷积神经网络和分层递归神经网络的图像分类模型,以更好地编码图像区域之间的空间和比例依赖关系,从而取得了在四个具有挑战性的目标/场景图像分类基准测试中最先进的结果。
Sep, 2015
本文介绍了一种深度神经网络模型,用于在两个空间维度上序列预测图像像素;该模型对图像的离散概率进行建模,并在深层循环网络中使用了快速的二维循环层和残差连接,实现了比以前的最新技术更好的自然图像日志似然度分数。
Jan, 2016
该篇论文提出一种基于卷积网络的像素优化方法,在此基础上将梯度下降转化为递归算法,并使用生成式对抗网络进行训练,生成高质量图像,并提出一种生成器与判别器间的量化比较方法。
Feb, 2016
本文介绍了一种基于深度生成模型的架构,该架构在训练过程中使用多层的潜在变量,并且在所有潜在变量和输出之间包括确定性路径,以及提供了一组更丰富的连接,这些连接在推理和生成计算之间实现了更有效的信息通信。我们在重构分布中引入了轻量级自回归模型以提高自然图像的性能。实验表明,我们的方法在标准图像建模基准测试中达到了最先进的性能,并且在没有标签信息的情况下可以暴露潜在的类结构,同时可以提供自然图像中被遮挡区域的令人信服的估计。
Dec, 2016
本文介绍了一种将因果卷积与自注意力相结合的新型生成模型,将其应用于密度估计任务,并在 CIFAR-10 和 ImageNet 上取得了最先进的结果。
Dec, 2017
本文提出了一种无需牺牲模型容量和设计复杂度,实现递归处理步骤恒定内存复杂度的学习算法C-RBP,该算法使递归视觉模型能够探测到长距离的空间依赖关系,并在MSCOCO的大规模全景分割挑战中具有比主流前向方法更好的效果。
May, 2020
该文提出了一种基于非线性小波表示的统计方法,其可以用作一层CNN的一种实例来提高图像纹理合成的视觉质量。该方法取代了以往经典的小波模型,并在灰度和彩色纹理上达到了与最先进模型相似的视觉效果。
Mar, 2022
本研究解决了自回归模型在图像生成任务中的不足,提出了一种统一的观点,强调潜在空间在图像生成建模中的稳定性。通过引入一种有效的离散图像标记器,我们实现了首个在图像生成上超越LDM的GPT风格自回归模型,展示了优化潜在空间和离散标记化对提升图像生成模型能力的潜力。
Oct, 2024
本研究解决了现有时间序列生成模型在处理短期和长期序列时的局限性。我们提出将序列转换为图像的方法,使得可以使用先进的扩散视觉模型,并在同一框架中有效处理不同长度的输入。实验结果显示,我们的方法在各项任务中均达到了优于先前模型的状态-of-the-art水平,特别是在无条件生成任务中,有显著的性能提升。
Oct, 2024