Mar, 2024

VSTAR:用于长时间动态视频合成的生成时域护理

TL;DR通过引入 GTN 概念,我们提出了一种名为 VSTAR 的方法,通过自动化生成视频摘要和时间注意力正则化技术,以改善 T2V 模型在生成长视频时的动态性,并实验证明了我们的方法在生成较长且具有视觉吸引力的视频方面的优越性。