Jan, 2025
视频分词器的渐进式生长用于高压缩潜在空间
Progressive Growing of Video Tokenizers for Highly Compressed Latent
Spaces
TL;DR本研究解决了在不增加通道容量的情况下,视频分词器实现超过4倍时间压缩比的挑战。通过发现低压缩编码器生成的时间下采样视频的重建质量优于高压缩编码器的原始视频重建,提出了一种新的渐进训练高压缩块的高时间压缩模型,显著提升了重建质量和时间压缩效率。这一方法对视频扩散模型的训练和高质量视频生成具有重要影响。