Mar, 2025

REGEN:使用(再)生成解码器学习紧凑的视频嵌入

TL;DR本研究解决了视频嵌入在生成建模中的准确性不足的问题,通过采用弛缓标准,提出了一种新的学习方法。研究中用扩散变压器(DiT)替代传统的编码-解码框架,显著提高了编码和解码性能,实验结果表明,压缩比最高达到32倍,使文本到视频生成的效率大幅提升。