Mar, 2025
稳健的潜在问题:通过采样误差提升图像生成
Robust Latent Matters: Boosting Image Generation with Sampling Error
TL;DR本研究解决了现有图像生成方法中潜在空间构建评估指标的不准确性和其对生成质量的影响。提出了一种新颖的插件式分词器训练方案,通过潜在扰动方法模拟采样噪声,并引入了一种新的评估指标pFID,有效关联分词器性能与生成质量,从而显著提升了分词器的稳健性和生成的质量。成果表明,使用该方法训练的分词器在多个高级离散图像分词器和生成模型中表现出更好的生成效果和收敛速度。