Oct, 2024

ε-VAE:去噪作为视觉解码

TL;DR本研究解决了现有视觉tokenization方法中重建过程的单一性问题,提出将去噪视为解码的新视角。通过用扩散过程替换传统解码器,该方法迭代性地精炼噪声以恢复原始图像,从而提高了图像生成和压缩的效果。研究表明,该方法在重建和生成质量上优于当前最先进的自编码方法。