Mar, 2024

VSTAR:用于长时间动态视频合成的生成时域护理

TL;DR通过引入GTN概念,我们提出了一种名为VSTAR的方法,通过自动化生成视频摘要和时间注意力正则化技术,以改善T2V模型在生成长视频时的动态性,并实验证明了我们的方法在生成较长且具有视觉吸引力的视频方面的优越性。