Sep, 2024

Open-MAGVIT2:一个迈向民主化自回归视觉生成的开源项目

TL;DR本研究解决了当前自回归图像生成模型在高效生成大词汇量图像时面临的挑战。我们提出了一种新的方法,通过不对称令牌因式分解优化模型的词汇量,并引入“下一个子令牌预测”以提升生成质量。研究结果显示,Open-MAGVIT2在图像重建方面达到了最先进的性能,并促进了这一领域的创新与创造力。