Oct, 2024
ARLON:利用自回归模型提升扩散变压器进行长视频生成
ARLON: Boosting Diffusion Transformers with Autoregressive Models for
Long Video Generation
TL;DR本研究解决了长视频生成中由于数据和计算资源限制所带来的效率问题。提出的ARLON框架通过结合自回归模型提供的信息,增强了扩散变压器的生成能力,显著提高了动态特性和美学质量,同时加快了生成过程,最终在长视频生成中实现了最先进的性能。